非接触式古籍扫描仪:关于古籍数字化的一些思考
随着电子技术的发展,古籍数字化已经成为必然之势,在当今时代,任何反对、阻止这种潮流的想法与做法,都是不足取的。确实,古籍数字化会使古籍的久远保存和广泛传播以发挥其自身价值,进一步落实、完善资源共享,使学者读到以前不易读到的书籍;会为研究者们提供便捷快速的检索服务,提供远比手工检索为全面、可靠的需要资料,使资料的转化、引用、运用异常迅速,甚至还会提供一些新的灵感和构思。总之,古籍数字化带给古代文学研究界的实实在在的好处,是谁也抹煞不了的。
首先是信息量的全部再现问题。古籍数字化,第一个要回答的问题就是是否做到了信息量的全部再现。信息量的全部,不是说现存全部古籍的数字化,而是就一部书所包含的全部信息而言。
一部书的全部信息,按照从外到内、从大到小的先后次序说,由这样几部分构成:
古籍信息的真实再现,就是建立在正确理解原文基础上的文字转化。没有“正确理解”这个前提,book2net非接触式古籍扫描仪即可做到真实再现,但复印、不能检索;数字化而没有“正确理解”这个前提,绝对不可能达到真实再现这个目标。
古籍数字化,必将为人们的阅读、研究提供非常多的好处,但同时,我们也不能不看到,古籍在数字化以后,也会滋生一些新的问题。这突出地表现在以下几个方面:
第一,误引误用成为常事。数字化具备异常快捷的检索、统计功能,于是乎,字、语词、意象使用频率的统计,典事*早或原始出处的查找,都可以在瞬间完成。不再需要一本书一本书地翻检,不需要一个人一个人地请教,只需输入关键字词,轻点鼠标,几秒钟一切事情都搞定。殊不知,这样检索、统计的结果,是不可靠的,其中有许多虚假数字。电脑虽然号称人工智能,在社会科学领域,毕竟不如人脑聪慧。它只能找出字或字串,不能区别同字之异义,区别相同字串的不同涵义。笔者为做《唐代试律诗研究》,曾检索电子版《四库全书》中的“试律”一词,可以得到144条,但合乎考试的律体诗歌这一意思的,只有几条;检得“试律诗”2条,全部不合要求。只要上一字是“试”,下一字是“律”,就会被它当作“试律”看待,其错误类型五花八门,如:“凡明法,试律七条令三条”(《新唐书》卷44),“进士诸科,始试律义十道”、“第一第二场,试律”、“亦试律义”、“仍罢试律义”(《宋史》卷155),“试律学第一,除参军”(《辽史拾遗》卷16)、“试律官二员”、“会试下第再举,直赴御试。律科进士,又称为诸科”(《金史》卷51)、“试律赋一首,律诗一首”(《太平治迹统类》卷27),还有宋代王庭珪《泸溪文集脱藁》目录,上一行是“送刘世臣赴省试”,下一行是“律诗七言”,也被嫁接成“试律诗”。这些“试律”、“试律诗”,完全脱离上下文的语言环境,不问“试”何指,“律”何义,随意组合,牵强成词。如果自己在电脑检索的结果出来后,不细加辨析,便会得出错误的结论。技术无道德,不需要负责任;但人是社会生物,需要对自己的研究负全责。
第二,青年人整体古籍阅读能力的下降乃至丧失。上世纪九十年代以来,在商品经济大潮的冲击下,在急功近利世风的影响下,越来越多的从事古代历史、文化史、文学史研究的人,急于成名,急于完成学业,不认真读书,只从他人的著作、文章中辗转稗贩一些古籍段落、字句,率尔操觚,轻易成文,本身的阅读力却不断下降。近年来的“国学热”、“读经热”,正是在青年人整体传统文化兴趣和功底都丧失殆尽形势下的危机应对策略,它是非常态的,不得已的。一旦古籍完成数字化,就有可能助长这种不读原典的坏风气。年轻一代的本科生、研究生,古代文化文学爱好者,发现可以非常轻易地得到师长辈们费尽九牛二虎之力才得到,或根本就得不到的研究资料,还会去孜孜矻矻地读经典,读正史,读诗词曲赋吗?数字化将造就一批学术懒人,这是可以预料也可以接受的;但是,以一代人甚至几代人古籍阅读能力、理解能力的下降乃知丧失为代价,换得数字化,那么,这个代价也太大了,相信是大多数人都不愿看到不愿接受的。于今之计,否定数字化,拒绝数字化,肯定是行不通的;加强思想道德教育,通过学校、老师(导师)给年轻人施加压力,估计收效也不会大。比较理想的措施,可能需要国家教育主管部门、文化主管部门,还有人事主管部门、学校、教师、家庭,多方合作协商,从人才培养、任用、考评等制度方面,制定出一整套长效机制,方能解决根本性的问题。
第三,数字化的法律秩序。首先是版权、著作权混乱。传世古籍,除了今人的影印、点校、注释、翻译之外,是没有著作权的,不涉及版权问题。但数字化以后,这个问题就变得复杂了。数字化算不算古籍整理?有没有产生新的著作人、版权人?这个版权如何维护?人们在使用数字化古籍成果时,要不要加署资料出处?而新的著作人、版权人,又是否能够保证使用者所引用资料的正确无误?具体而言,图像版的古籍(数码拍照)有无版权?如果有,版权是归藏书单位,还是归图像制作者?数字化的古籍,有无版权?版权归谁?这些问题,就目前的数字化古籍市场看,显得十分混乱。国家尚未出台一部针对数字化古籍的法律法规,因而市场无准绳可依。其次,数字化进程混乱。现在是诸侯割据,各占一方。只要投入资金,都可以进行古籍数字化。而缺少统一部署,统一调度,有限的人力资源、资金资源,得不到有效的整合、协作,从而使古籍的数字化出现较为严重的重复施工、整体布局失衡的现象。一些较为热门的古籍,不断被人数字化,冷僻一点的,则无人问津。除了《四库全书》、《四部丛刊》等少数几部外,大量的大型丛书(当然,不少丛书的细目,存在交叉重合,数字化时,也需要协调,免得重复投入),成了被电子技术遗忘的角落,成了电光、激光普照不到的阴暗地方。为此,我们呼唤相关法律法规的出台,盼望数字化市场早日法律秩序化。
珍藏的历史书刊、古籍扫描是图书馆、档案馆和博物馆面临的一项重要工作,共享珍贵的历史文案,如何快速高效地将书刊和古籍变为可随时查阅共享的电子影像资料,是档案工作者迫切需要解决的首要问题。
book2net古籍扫描仪特点:
A2幅面扫描区域
非接触式扫描,无需拆档
0.3秒超快扫描速度,1.9秒扫描周期
2000页/时
配备 40 ,50万像素传感器
提供OCR识别技术
针对一定厚度图书可维持扫描台的平衡
3亿次快门,使用寿命超长
罗德刚*大镜头,景深高达12.5cm
36位捕捉,24位输出
支持多种文件格式,TIFF,JPEG,PDF(多页文件)等
配送强大*的book expert扫描和图像增强软件
流程化扫描管理,提高工作效率
www.bookeye.com.cn