《纸质档案数字化规范》2017年修订颁布,新增一项重要内容,即“增加数字化过程中元数据采集的要求”。
新标准“总则”规定:“纸质档案数字化过程中,应保存数字化项目信息、技术环境、数字化各类技术参数等方面的元数据。元数据元素的确定应符合ISO/TR 13028提出的要求。”在数字化成果的验收环节也明确要求“应对元数据进行验收,主要包括元数据元素的完整性和赋值规范性等。”
什么是元数据?形象地说,就是数字化成果的身份证,是表明A数字化文件不同于B数字化文件的东西。
纸质档案数字化增加元数据,对于保证数字化成果的真实性和完整性是非常有益的,进一步提升了档案数字化成果的价值和权威。对于实现以数字化成果“代替原件”加以保存和利用,迈出了关键的一步。但是,作为国家标准,在新增元数据的修订上,还有几个值得进一步完善的地方,以便各部门、各单位的具体操作和实施。
第一:关于元数据元素项目的确定。
按照新标准的要求,数字化元数据至少包括三方面的信息:一是数字化项目信息;二是数字化技术环境的信息;三是数字化各类技术参数的信息。
至于每个方面具体包括哪几项元数据,新标准没有具体罗列,仅仅要求“元数据元素的确定应符合ISO/TR 13028提出的要求。”ISO/TR 13028这是一个英文版的国际标准,由国际标准化组织制定并发布,其中文名可译成《信息与文献 档案数字化实施指南》。我国有个与其相对应的国标是《文献档案资料数字化工作导则》(GB/T20530--2006),由国家档案局共同参与起草。由于国标《文献档案资料数字化工作导则》是2006年颁布的,成文时间较早,10多年了,一直没有修订更新,所以,国标全文只字未提元数据的内容,《纸质档案数字化规范》只能舍近求远,提出纸质档案数字化元数据元素的确定应符合ISO/TR 13028国际标准了。
2009年国家出台过《文书类电子文件元数据方案》(DA/46--2009), 曾提出79项元数据,作为文书类电子文件归档采集标准。此后,又相继出台了《照片类电子档案元数据方案》和《录音录像类电子档案元数据方案》。目前对于纸质档案的数字化元数据究竟确定多少项元素,尚是一个未知数。元数据缺乏标准,纸质档案数字化元数据的验收要做到元素的“完整性和赋值的规范性”是无法操作的。为配合《纸质档案数字化规范》的实施,纸质档案数字化元数据的采集方案,宜尽快出台标准,配套实施。
第二,元数据的组织和管理。
元数据是每份档案的身份证明,是伴随着每份档案共同保存和利用的。新标准规定,纸质档案数字化完成后,形成的图像文件与目录数据进行挂接,构成一份数字化成果。这种数据组织方式对于原标准条件下形成的数字化成果的管理是合适的。但是,新标准新增了元数据,如何保证元数据与数字化成果逐一对应,成了一个新的课题。电子文件管理中采用封装技术来实现元数据与电子文件的“捆绑”,那么,在纸质档案数字化成果的管理中是否也要采用封装技术来保证元数据与数字化成果的“结合”?有人曾提出采用“双层PDF”来实现图像与元数据的“捆绑”管理,这种方案解决了网络利用中的元数据与图像的“合一”问题,但是,不解决数字化成果“替代原件”保存的问题,因为,PDF对扫描图像做了巨大的压缩,它只适合网络利用,不适合用作长期保存的存储格式。为此,新标准既然新增了纸质档案数字化元数据,还应尽快出台配套的纸质档案数字化元数据保存和管理的相关标准与规范。
纸质档案数字化是一个系统工程,《纸质档案数字化规范》是引导和规范该项工作管理和操作实施的技术标准,每个指标与内容的确定,都事关数字化全局,必须全面考虑,才能保证数字化的工作不走回头路。
(本文转载自兰台拾遗 作者:韩李敏 作者单位:原浙江省档案局)
主办:海南省档案局 开发维护:海南信息岛技术服务中心
电话:0898-65363047 传真:0898-65226652 邮箱:hnda@hi.gov.cn
琼ICP备05000041 政府网站标识码:4600000028 琼公网安备 46010802000306号
您访问的链接即将离开“海南省档案信息网”门户网站
是否继续?