当前位置:舍宁秘书网 > 专题范文 > 公文范文 > 档案数字化处理技术及其应用

档案数字化处理技术及其应用

时间:2024-09-14 13:15:02 来源:网友投稿

摘 要:档案数字化是时代发展的新趋势,大数据、区块链、人工智能等先进技术的应用,大量电子文档成为重要的战略数据资源。档案数字化工作是时代发展的趋势,应坚持科学、系统、整体、安全、可行原则,开展档案数字化。本文简要探讨了纸质档案、音视频档案和实物档案数字化类型及相应技术参数,以及档案数字化处理常用的技术,并以实物档案数字化为例,提出档案数字化处理技术在实物档案数字化中的实际应用和需要注意的问题,为提升档案数字化处理能力和水平提供一定参考。

关键词:档案数字化;
处理技术;
应用

前言

数字化(Digitalization),是将信息转换为数字(即计算机可读)格式的过程。即将任何复杂多变的信息转变为可度量的数字、数据,再以这些数字、数据建立起数字化模型,转变为一系列二进制代码,引入计算机统一处理的过程。档案数字化是指利用扫描仪等设备将档案进行扫描、压缩、转化等数字化加工,使传统纸质档案、录音录像档案、实物档案等转化为图片、声像存储于磁带、磁盘、光盘等载体上的数字文件,并按照档案内在联系,建立目录数据与数字文件关联关系的处理过程。亦即将非计算机可识别的载体上的信息转换为0、1代码组成的计算机可识别电子文件的过程。近年来,《档案数字化外包安全管理规范》《数字档案系统检测办法》等政策标准的出台和实施,有力推动了档案数字化产业发展。据统计,2022年我国档案数字化行业市场规模达68.8亿元,较2017年的40.5亿元增长了69.88%。档案数字化是时代发展的新趋势,随着大数据、区块链、人工智能等先进技术的应用,电子文档已经成为重要的战略数据资源。

1 档案数字化原则

档案数字化需要应用到数据压缩技术、高速扫描技术、数据库技术、光盘存储技术等,将纸质、音视频、实物档案转化为计算机可识别信息和处理,应遵循如下原则[1]:一是科学性。档案数字化技术性要求极高,通常需要委托第三方专业机构协助完成。在数字化前需要做好各项准备工作,尤其是要对馆藏档案资料进行鉴定,从实际出发进行筛选,确定数字化范围,根据轻重缓急,分阶段、分层次、分步骤进行。因此,从档案數字化的技术选择、参数设置、数字化范围等,均需要立足实际和档案管理现实需要,遵循科学原则。二是系统性。档案数字化系统性既包括信息资源的系统性,也包括数字化软硬件的系统性。前者是指对馆藏档案资源进行系统整理,重点或特色档案数字化应保持其系统、连贯和完整,确保数字化后的档案信息保持内在逻辑联系。后者是指档案数字化应用到的软硬件配备、数据库建立等,在数字化各个环节阶段都要保持一致性,以确保档案数字化可持续性。三是整体性。档案数字化是档案管理工作的重要组成部分,应将档案数字化纳入机关、单位或部门档案事业发展总体规划之中,遵循整体性原则。即档案数字化标准、规范和要求要保持统一性。运用先进的数字技术、信息技术,实现档案数字资源的共建共享,通过档案数字化提升档案管理整体价值功能。四是安全性。安全是档案数字化的底线。大量先进技术的应用,使得档案面临着诸多的非传统安全因素威胁,做好档案数字化信息真实、完整、保密就显得非常重要。既要防数据信息泄密,也要防数据信息丢失。就需要采取数据加密、数据备份、身份认证等先进技术,确保档案数字化安全。五是可行性。档案数字化处理面临着多种技术和方案的选择,可行性是要求档案数字化最大限度地满足实际操作要求。档案数字化还涉及后期的系统运行、维护和管理,对人力、物力、财力都有较高要求。因此,档案数字化应量力而行,根据单位馆藏档案实际,人才队伍能力水平,经费保障力度等,选择切实可行的技术和方案。

2 档案数字化类型

2.1 纸质档案数字化

《纸质档案数字化规范》(DA/T31-2017)规定,纸质档案数字化就是指采用扫描仪等设备对纸质档案进行数字化加工,使其转化为存储在磁带、磁盘、光盘等载体上的数字信息,并按照纸质档案的内在联系,建立起目录数据与数字图像关联关系的处理过程。纸质档案数字化包括数字化前处理(确定扫描页、编制页号、目录数据准备、拆除装订、技术修复)、目录数据库建立、档案扫描(扫描设备、色彩模式、分辨率、存储格式)、图像处理(拼接、旋转、纠偏、裁边、去污、质检)、数据挂接、成果验收与移交等主要环节(见图1)。纸介质资料的数字化方法主要有手工录入、扫描、数码相机等[2]。纸质档案数字流程如图所示。

2.2 音视频档案数字化

《录音录像档案数字化规范》(DA/T62-2017)规定,录音录像档案数字化是指对模拟录音录像档案进行数字化加工,使其转化为存储在磁带、磁盘、光盘等载体上的数字音频文件和视频文件,并按照录音录像档案的内在联系,建立起目录数据与数字音视频文件关联关系的处理过程(见图2)。音视频档案数字化技术参数包括:录音档案数字化采样率>44.1kHz;
量化位数24bit;
原始声道数记录;
存储格式为WAVE。录像档案数字化技术参数包括:采用H.264或MPEG-2IBP视频编码格式;
与档案原件相同帧率、画面宽高比;
标清色度分辨率>4∶2∶0;
高清色度分辨率4∶2∶2;
量化位数≥8bit,特殊视频量化位数≥16bit;
存储格式为AVI或MXF。需要将录音录像档案进行文件切分与著录。音视频档案数字化流程如图所示。

2.3 实物档案数字化

根据《实物档案数字化规范》(DA/T89-2022),实物档案数字化是指采用拍摄、扫描等方式对实物档案进行数字化加工,将其转化为存储在磁带、磁盘、光盘等载体上的数字文件,并按照实物档案的内在联系,建立目录数据与数字文件关联关系的处理过程。实物档案数字化需要利用三维扫描技术,反映实物档案空间外形、结构及色彩等特征信息发生显著变化的临界点。实物档案数字化重点是数字化采集,采集的方式有平面扫描、三维扫描、数码拍照、环物摄影,其中实物档案数字化三维扫描精度≤0.05mm;
点间距≤0.254mm;
纹理色彩≥32位色;
扫描距离400-600mm;
几何数据存储格式有3DS、3DAMX、WRL、DAE等;
纹理数据存储格式有JPG、TIFF、TGA等。实物档案数字化数字采集完成后还需要旋转、纠偏、去污、拼接、降噪、数据平滑。实物档案数字化流程如图所示(见图3)。

3 档案数字化处理技术

一是计算机网络技术,是档案数字化过程中基础性技术[3]。包括数据处理、实时控制、图像文字处理、多媒体技术等。网络技术包括档案操作系统、数据传输、存储和信息共享等。二是扫描技术,是一种文件图像转化为电子文件的技术。扫描技术中又包括电机技术、色彩增强技术、校正技术、一次曝光扫描技术、一次镜像系统技术、双镜头扫描技术、共享扫描技术,等等,档案数字化扫描技术根据纸质、音视频及实物档案不同,选择不同扫描仪和扫描方法[4]。三是数据库技术,是信息系统的核心技术,是计算机辅助组织、存储及高效获取、处理数据。数据库技术应用减少数据存储冗余、实现档案数据信息高效检索、共享。四是光盘刻录技术,计算机中档案数据经软件处理,将二进制数据刻录保存在空白光盘[5]。光盘质优价廉,可将海量档案数据信息刻录备份至光盘上,实现档案数据存储。后期,可在VCD、DVD机播放。此外,还有压缩技术、OCR文字识别技术、分级存储技术、多媒体检索技术、信息安全技术等,也是档案数字化处理过程中常用到的各种应用技术[6]。

4 档案数字化技术应用及需要注意的问题——以实物档案数字化为例

奖牌、奖杯、证书、徽章、纪念章等实物档案,形态各异、类型多样、大小不一、材质不同,但都直观、形象地体现了一段发展历史,做好这些实物档案数字化,可提升档案管理信息化水平,在档案检索利用过程中,也能够减少对实物档案原件侵扰而起到很好的保护作用。

4.1 拍摄、扫描技术

锦旗、印章等能够以二维静态图像形式展示的实物档案,选用彩色数码相机进行拍摄或者进行平面扫描。一些重要的大型仪器、设施设备需要以三维全景影像形式展示的,需要对其进行环物摄影。无论是实物档案拍摄还是扫描,都要保证实物档案与成像之间保持一一对应关系,且同一种拍摄方式应采用相同存储格式。

4.2 图像处理技术

在实物拍摄、扫描完成后,还需要对图像进行图像数字化、图像增强和复原、图像数据编码、图像分割和图像识别等技术处理,包括模拟图像处理和数字图像处理[7]。前者,如拍摄的实物档案模拟信号图像进行处理。后者,主要是借助计算机及应用软件进行处理。图像处理包括去污、拼接、旋转、纠偏,多余的白边还需要进行裁边处理,减少图像文件容量,增加视觉美感。图像处理时应注意保持与实物档案一致,确保档案数字化图像完整、档案信息忠实于原貌,不得擅自修改档案信息。

4.3 档案数据录入

将采集到的实物档案信息录入目录数据库。严格按照实物档案的类别、时间先后顺序将图像信息内容按照条目逐条录入目录数据库[8]。档案数据录入结束,还需要进行核查,重点是核查录入内容与目录数据库条目总数是否一致,信息内容是否遗漏或重复。录入后的实物档案目录数据应包括档号、年度、保管年限、题名、技术环境、责任者、材质等技术参数信息。

4.4 数据备份

对经核实无误的实物档案数据信息及时进行备份。为确保实物档案数据信息安全,可采用移动硬盘、VCD光盘、DVD光盘等进行数据备份。备份结束时,还要检查备份介质内的档案数据备份信息是否齐全、完整,能否打开,并贴好标签,便于查找和利用。

4.5 数据挂接

将核查无误的单机版档案管理系统的档案数据完整导入网络版档案管理软件[9]。数据挂接后还需要逐条检查,重点是要检查目录数据与实物档案数字影像对象的准确性,已挂接数字影像与实物扫描数量的一致性,以及数字影像能否打开。数据挂接完成,实现实物档案数据与机关局域网挂接。通过登录局域网查询、检索库存的实物档案条目及详细内容。

4.6 实物档案数字化需要注意

一要保护实物档案实体安全。在数字化过程中,扫描或拍摄时要注意安全,防止造成实物档案二次破坏。二要注意实物档案特点。奖杯、设备、仪器、纪念品等实物档案形状多样、复杂,拍摄或扫描时应全方位、立体式数据采集,选择多方位拍照组合的形式,反映实物档案全貌。三要注重标准化问题。实物档案数字化应严格执行《实物档案数字化规范》、标准平台等的规定,确保系统的开放化、可扩展性,便于后期随着技术的发展,系统或软件能够及时升级或移植,尽量不要采用封闭式的技术和标准。四是注重存贮问题。大量的实物档案数字化也会占用大量的设备存贮空间。在实物档案数字化前,检查存贮空间是否够用,选择磁盘阵列、磁带机、服务器硬盘、光盘等合适存储的空间。五是注意实物档案数字化处理过程。实物档案数字化处理包括原始档案保护、数据捕获、数据处理、存贮、检索与显示等环节,其中数字化只是其整个处理过程中的重要一部分。不能一味关注纯数字化工作,而忽视其它一些更为重要的处理环节。要把实物档案数字化与管理、存贮、检索与利用等放在同等重要位置,才能保证成功。

参考文献

[1]方毓宁.馆藏档案数字化十原则[J] .中国档案,2004(4):37-38.

[2]魏自鹏.纸质档案数字化的原则、路径与方法探讨[J].安徽电气工程职业技术学院学报,2020(4):31-34.

[3]高珂佳.浅谈档案数字化背景下的档案利用[J].航天工业管理,2023(3):78-80.

[4]颜丙通.纸质档案数字化测评:方法选取与实施步骤[J].湖北开放职业学院学报,2022(17):141-143.

[5]姜向聪.档案数字化与档案安全的协同建设路径[J].兰台内外,2022(9):31-33.

[6]牛秀英.档案数字化的再探讨[J].城建档案,2009(1):59-61.

[7]王小娟,斯庆.数字档案室建设过程中各类档案数字化方法探究——以鄂尔多斯职业学院为例[J].文化创新比较研究,2019(17):147-148.

[8]唐萍萍.铁路实物档案数字化方法与利用探析[J].办公室业务,2017(3):75-76.

[9]李子萍.浅论实物档案数字化过程[J].冶金管理,2020(5):249-250.

作者简介:孙鹏(1987— ),大學学历,盘锦市兴隆台区政府馆员,主要从事档案研究。

猜你喜欢档案数字化处理技术应用搭建档案管理数字化建设平台 实现国土资源信息现代化吉林农业·下半月(2016年11期)2017-01-09档案数字化管理优势与弊端现代商贸工业(2016年9期)2017-01-07浅析城市生活污水处理技术现状及发展趋势中小企业管理与科技·上旬刊(2016年10期)2016-11-15Java千万级别数据处理与优化数字技术与应用(2016年9期)2016-11-09档案数字化管理建设中存在的问题及对策科学与财富(2016年28期)2016-10-14GM(1,1)白化微分优化方程预测模型建模过程应用分析科技视界(2016年20期)2016-09-29煤矿井下坑道钻机人机工程学应用分析科技视界(2016年20期)2016-09-29气体分离提纯应用变压吸附技术的分析科技视界(2016年20期)2016-09-29会计与统计的比较研究大众理财顾问(2016年8期)2016-09-28高校档案管理嵌入数模整合系统研究科技视界(2016年13期)2016-06-13

推荐访问:数字化 及其应用 档案

猜你喜欢