外文老报纸篇名数字化项目外包后的数据质量监控

所属栏目:高级职称晋升论文 发布日期:2018-11-24 14:08:06 论文作者:佚名
刘洪梅 梅颢 郭薇摘要:基于PDCA循环这一质量控制程序,文章结合外文老報纸篇名数字化项目外包后数据验收的实践,就外包后数据验收的标准流程和质量监控进行了探讨,以期对图书馆外文报纸数据库外包质量控制和管理提供参考和帮助。关键词:数字化项目外

刘洪梅 梅颢 郭薇

摘要:基于PDCA循环这一质量控制程序,文章结合外文老報纸篇名数字化项目外包后数据验收的实践,就外包后数据验收的标准流程和质量监控进行了探讨,以期对图书馆外文报纸数据库外包质量控制和管理提供参考和帮助。

关键词:数字化项目外包;PDCA循环;标准验收流程;质量控制;外文老报纸篇名 文献标识码:A

中图分类号:TP319 文章编号:1009-2374(2017)11-0119-03 DOI:10.13535/j.cnki.11-4406/n.2017.11.061

1 概述

受人力、物力和财力等因素的影响,为提高制作效率,不少图书馆在建设特色馆藏数据库时,会采取外包的形式给专业的数字化生产制作商加工,再由图书馆进行数据接收和验收。由于外包方制作工艺的不完善和加工人员素养的参差不齐,导致在数字化项目制作过程中存在诸如漏著录、元数据与图像勾链错误、篇名类型判断错误、著录规则错误率高、文字错误频出等问题。为了对外包后的数字化项目进行有效的质量管理和控制,就必须实施全面质量管理,按照PDCA循环这一基本管理程序进行质量控制。本文将PDCA循环的四个步骤应用于外文老报纸篇名数字化项目外包后数据验收的实践,就外包后数据验收的流程和质量监控问题进行探讨,以期对图书馆外文报纸数据库外包质量控制和管理提供参考和帮助。

2 PDCA循环

PDCA循环又叫戴明循环,它最早的雏形是美国统计质量控制之父休哈特提出的“计划-执行-检查(Plan-Do-See)”,后由著名质量管理专家戴明博士进一步完善,发展成为“计划-执行-检查-处理(Plan-Do-Check/Study-Act)”,成为PDCA循环,它作为一套科学系统的思维方法和管理程序,被看作是全面质量管理的最基本的工作程序。

PDCA的含义如下:P(Plan):策划、计划;D(Do):执行、实施;C(Check/Study):检查、评价、诊断;A(Action):处理、总结、提高。详见图1。

就应用而言,PDCA分别对应以下四个阶段:

计划阶段:摸清用户对产品质量要求,确定质量目标和质量计划。

执行阶段:实施计划阶段所规定的内容,根据质量标准进行产品设计、试制、实施,包括进行人员培训。

检查阶段:根据目标和产品要求,检查执行情况,对过程和产品进行监视和测量。

处理阶段:对总结检查结果进行处理,采取措施巩固成绩,进行标准化,遗留问题和新问题则转入下一个PDCA循环去改善和提高。

PDCA循环是周而复始,螺旋上升,持续改进的动态过程,一个循环结束,解决一些问题,未解决的问题进入下一个循环。处理阶段是PDCA循环的关键。因为处理阶段就是标准化和问题总结,处理存在遗留问题。该阶段的重点又在于标准的修订和完善,包括技术标准和管理制度。标准化和制度化是推动PDCA循环转动向前的根本动力。

3 基于PDCA循环的外文老报纸篇名数字化项目验收流程

3.1 计划阶段:制定验收计划,确定验收质量标准

在项目启动初期,验收组需根据外包方提交的数据交付进度表和生产计划,制定相应的验收计划,确保项目能如期完工。同时验收组还需与元数据制作部门协同,制定数据制作标准及验收软件标准,主要包括以下三个方面:

3.1.1 元数据著录质量标准。主要涉及图像处理差错率、元数据著录规则差错率、著录文字差错率、元数据与图像的勾链无差错、标题中文翻译数据差错率及版面内容元数据无漏著等。

3.1.2 数据规范格式。主要涉及单版PDF文件、单版JPG格式图像、著录广告JPG格式图像、元数据著录信息文件、版面分析信息文件等。交付时包含PIC、TIF、XML、OCR四个目录,交付数据结构样例如图2所示:

3.1.3 验收软件标准。要求外包方开发的验收软件能按照批次进行图像和数据的验收,可在局域网内部署,多人在线分工进行验收。

3.2 执行阶段:培训验收人员,按批次进行数据验收

3.2.1 对验收人员进行培训。培训内容主要包括:熟知并掌握中外文老报纸篇名元数据(元数据:指报纸图像中有相对明显物理边界内的内容完整的正文、广告或图片)著录规则、中外文老报纸篇名元数据著录细则以及著录技术规范;学会熟练运用中英文老报纸验收软件进行验收;学会熟练运用上海图书馆文献数字化及知识制作元平台进行验收。

3.2.2 按照批次进行项目验收。在进行数据验收时分批次进行,首先数字化项目验收平台进行合法性差错校验。合法性校验的主要内容包括:(1)XML合法性:XML结构正确性、XML能否解析,XML是否存在勾连错误等;(2)XML版面信息著录与资源表、划到表核对;(3)非空字段核对;(4)XML中著录内容是否符合著录规则;(5)元数据与图像对应关系核对。具体操作如图3所示:

合法性校验之后会生成合法性差错列表反馈给外包方进行修改。

在通过合法性校验之后,该批次数据可以进入人工校验阶段。总校采取“等差抽样+随机抽检”的方式进行抽样。校验人员在领取抽样分工单之后利用验收软件逐篇进行数据验收,验收界面展示如图4所示:

在发现著录错误时,一校验收人员可在验收平台进行相应的错误登记,错误登记界面如图5所示。

进行错误登记会自动生成Excel格式的差错表,所有的差错表由总校进行汇总与整理,确保验收的一致性和统一,最终由项目主管将按批次整理的验收差错反馈表发送给外包方进行数据修改。

3.3 检查阶段:返工数据核验,实行技术合法性校验

3.3.1 进行返工数据核验,确保差错已改。对于每批返工数据,验收组首先进行合法性校验,对于不通过合法性校验的数据直接退回外包方进行二次改错;对于通过合法性校验的数据采取“已抽样部分必检+未抽样部分随机抽检”的办法进行验收,确保外包方百分之百完成已反馈差错的修改,对于修改不合格的批次进行二次返工;对于修改合格的批次则进入最终的成品规范合法性校验。

3.3.2 对通过验收的数据进行成品规范技术合法性校验,切实检验验收成果。对于通过合法性校验和人工数据验收的数据,则按批次交付验收组技术人员进行最终的成品规范技术合法性校验。校验内容主要包括勾连检查、非空校验、空版面检验、数量校验、数据库表验证、划到表比对、坐标检查等。对于未通过技术合法性校验的批次,则返回外包方继续修改至合格为止。对于通过技术合法性校验的批次,则填写成品数据交接单,随后进行拷贝存储,至此验收工作完成。

3.4 处理阶段:建立标准验收流程,反馈未解决问题

3.4.1 建立标准验收流程。基于三年的外文老报纸篇名数字化项目验收实践,笔者将验收组形成的标准验收流程总结如图6所示:

3.4.2 总结反馈未解决问题。

第一,著录内容方面的问题。在数据验收过程中,经常会遇到全新的加工资源和各种各样的著录问题,此时验收组的成员不仅会和外包方及时沟通协调,遇到悬而未决的专业问题时,还会及时请教报纸元数据制作的专业人员,并形成了相关的著录细则,达成新的著录规则补充协议等,保障了各种外文报纸加工项目的顺利进行。

第二,著录规范方面的问题。按照标准验收流程,数据验收的第一步和最后一步都要进行技术相关的合法性校验,验收组在实践中发现有以下三种错误是在数字化项目验收平台无法查明的:(1)数据提交数量核对;(2)篇坐标格式错误(坐标过长);(3)广告抠图命名错误。经反馈给技术人员后,前两个问题已经在数字化项目驗收平台得以查明和解决,最后一个问题目前还是只有最终合法性校验才能查验,这一技术问题有待在今后的项目中加以解决。

第三,成品数据上线后的用户体验与反馈。检验产品的服务质量好坏最直接、最有效的标准就是用户体验与满意度。外文老报纸篇名数字化项目的成品是外文老报纸全文数据库,售后服务部门应及时收集客户的使用反馈和评价,以便在今后的项目制作和验收过程中实现进一步的改进和提高。

4 结语

PDCA循环为馆藏外文报纸篇名数字化项目验收和质量控制提供了理论支撑和方法步骤,根据PDCA循环结合验收实践形成的标准验收流程是对外包数字化项目进行质量控制的关键所在,同时我们也应当充分意识到人的主观能动性对于实施效果的重大影响。一方面,图书馆项目负责人应加强与外包方制作人员的实时联系与沟通,确保制作过程中出现的任何问题都能在第一时间通过妥善的处理和协调得以解决,甚至可以通过不定期实地考察和现场监控,确保外包的生产制作过程和标准符合要求;另一方面,要加强验收组的团队管理,通过定期开展验收技能培训和专业知识讲座等形式,不断提高验收人员的专业技能和素养,同时也应注意培养验收人员的主人翁意识和责任意识,在单调繁琐的验收工作中增强员工为图情事业服务的使命感和荣誉感,更好地揭示和保存珍贵的馆藏特色资源,为读者用户提供更优质的数字资源服务。

参考文献

[1] 陈新洁.图书馆编目外包质量控制与绩效评价研究[J].图书馆论坛,2011,(4).

[2] 韩春磊.图书馆馆藏特色文献资源的数字化深加工模式探析[J].科技资讯,2012,(25).

[3] 陆耘.外包数据质量控制初探——以中国科学引文数据库为例[J].河南图书馆学刊,2013,33(4).

[4] 吴佩娟.期刊论文数据库外包过程中的质量控制[J].图书馆杂志,2013,(6).

[5] 邢秋霞.浅谈高校图书馆特色数据库的建设[J].科技情报开发与经济,2010,(4).

作者简介:刘洪梅(1990-),女,山东潍坊人,供职于上海图书馆上海科学技术情报研究所,研究方向:文献资源数字化项目审验与管理;梅颢(1989-),女,上海人,供职于上海图书馆上海科学技术情报研究所,研究方向:文献资源数字化加工与项目管理;郭薇(1971-),女,江苏太仓人,供职于上海图书馆上海科学技术情报研究所,研究方向:图书馆文献资源的数字化制作、数据规范化、数据加工内容分析与挖掘与项目管理。

(责任编辑:蒋建华)

星火论文网是业内有序经营时间较长的综合性论文网站之一,因为专注,所以专业。论文写作辅导的老师全部是由武大、浙大、华中科大、中科大、西南交大、复旦等高校名牌院校的硕士及博士生,目前已为上千位客户解决了毕业论文写作的困扰、职称论文发表的难题。自成立以来,客户一直放在我们的首要位置,客户满意是星火论文网的终极目标,在络绎不绝的好评声成就了星火论文的品牌。历经12载,打造了一个硕士论文、本科论文及职称论文发表的平台网站。拥有海量的高质量的原创论文,可以提供经济、管理、法律、医学、会计、体育、历史、教育教学、建筑等专业的毕业论文范文参考及硕士论文写作等服务。服务范围:论文发表、论文写作及外文翻译等等!
27926090 13943037437