概述
随信息技术的飞速发展,带来了文档管理及存储、利用方式的革命。用文档电子影像数字化信息代替纸张等传统介质,不仅大大节约了存储空间,无限地延长了保存时间,同时为查阅利用带来了极大的便利,因此,文档数字化逐渐得到图书馆、档案馆等各行各业用户的一致认可。
文档数字化是指利用计算机技术、网络技术和智能识别技术将传统的纸质信息转化成计算机内码或图像。然后将数字化的信息发布于局域网、广域网,形成若干个数字信息集群,供相关人员方便地查询利用。
国家863计划数字图书馆战略小组组长,原文化部副部长徐文伯指出:数字图书馆建设是一场没有硝烟的战争,要用中文信息资源去占领这块网络阵地。国家档案局国家档案事业十五规划明确提出,要大力推进档案信息化建设,在全国有条件的部分地区、部分行业率先建成一批数字化档案馆室。
在日趋激烈的国际竞争中,谁掌握的信息资源,并使之转化为经济技术优势,谁就掌握了竞争和生存发展的主动权。信息资源电子化是人类社会文明进步的必然趋势,能否跟上国际潮流,完成信息资源电子化进程,关系到一个国家、一个民族的兴衰。
数字化实施数字太微档案数字化解决方案是指对档案进行分类整理、标引着录、图像扫描与处理、案卷整理、移交进馆等工作的总称。
一、档案分类整理
档案分类整理是指将文档进行分解整理,包括原件的拆卷、起订、粘贴页撕开,页号编写有误的重新编号。并按扫描后的电子文件组织形式进行重新分类,以便扫描时的批次处理。
二、档案交接
分类整理后的档案按时间先后或其他分类项顺序提出、提卷时编写档案的页号和需要扫描录入的文件页号及抽取不需扫描的页面,并按实际页数填写详细的档案交接清单,并由双方主管人员签字。
三、标引着录
标引着录为了方便查阅与管理,打印制作档案目录及档案封面,对文字录入的准确性要求较高,但要录的文本域并不是完全统一的在某一页面上,一些文本域要在多个文件中选择,所以录入时需要相关档案管理人员进行指导,制作相应的《文字录入工作说明书》,确保文本域录入的准确率。
四、档案拆分
档案拆分前要对档案进行统一的编号,编制总页号后,要从中选中需要扫描的页面。再一次编制所需扫描的页号,两个页号需用铅笔的颜色或位置区分,以确保档案还原时能够清楚区别和核时页数。
档案拆分时要严格按照要求对不需扫描的页进行标注。
五、档案的扫描
原件的扫描与存储格式完全按照国家档案管理的统一标准要求扫描。扫描人员按照《扫描与处理工作说明书》的要求,填写移交清单(此移交清单是档案拆分人员和扫描人员共同填写)并签字领取,再进行纸件扫描。扫描图像使用先进的图像扫描处理软件(快图像系统),扫描人员可根据原稿质量,对系统进行定义,如自动倾斜校正、自动去污、自动分文件等批处理功能。在由系统自动处理功能的同时,扫描人员根据原件的实际情况做相应的调整,如超大页面的处理、纸张颜色深浅及薄厚的处理、扫描时可根据不同原件的情况,调整图像的分辨率、阀值、明亮度以及扫描方式和扫描速度,确保在扫描图像质量清晰的情况下,使原件完好无损。
图像的分辨率正常情况下为200dpi,如遇字间距和行间距过密、原件本身是复印件等字迹不清楚的情况,可适当增加扫描的分辨率,但要保正图像清晰的同时,又不影响远程查询和浏览的速度。
六、图像处理
数字太微档案数字化系统采用自动化处理和人工处理相结合的方式,确保图像质量的*。通过校对系统对图像进行校对,确保图像顺序正确、去斑点,在校对时,发现不合格图像及时返回前一工序进行改正。
(1)污渍、黑边、偏斜处理
(2)全文字面的扫描密度
(3)粘帖页与表格
(4)插图
(5)照片页的处理
(6)存储格式与页面空间分辩率:200dpi图像格式:TIFF、JPG储存空间:A4,20-30KB/页
七、质量检验
对扫描处理完成后的图像页进行检验,对档案拆分、扫描、修正、去污、插图、照片的处理以及文本和图像页的匹配等质量进行全面检验。
对文本域录入与文本录入域的标引、文件的页号及页数进行对比,对扫描前图像页的标引与扫描后的图像页的编号与页数进行对比,发现不合格的登记清单并退回上一流程重新处理。
八、挂接
文本域录入和扫描处理检验后的图像成品,由系统自动进行文字图像与系统的匹配挂接。挂接到档案管理系统中后,进行再次的成品验收。
九、案卷整理
档案整理工作严格按照国家档案局规定的相关标准和本单位的实际情况进行有序的整理,安排加工人员负责案卷合并与整理。