我国宏富浩繁的文化典籍,是中华民族政治、经济、历史、文化和民族精神的重要载体。据专家估计,中国存世古籍总计在10万种以上,如果计入碑刻、家谱等,约有15万种左右。这些存世古籍,负载着厚重的中华文明,凝聚着民族智慧,是祖先留给我们的一笔庞大的精神遗产。
古籍数字化,简言之,就是利用现代信息技术对古代文献进行整理与研究,并以电子数据的方式提供使用。数字化的古籍再配合一定的检索软件,使古籍的阅读、翻检都大为便利,扩展了囿于时间、精力的个人有限的阅读能力,正如古人梦想的神笔,顷刻间可以将万卷诗书尽控于掌中。
古籍数字化大约兴起于上世纪90年代,当时仅限于电子文本阅读,也因为计算机的普及程度低,参与此项工作的范围极其有限。目前,各类学术政府部门、研究机构、大专院校乃至个人都纷纷加入到古籍数字化的队伍中来,致使这一新兴领域在短短10年中,迅速发展,目前大约有1万种古籍,总字数达40亿字的古籍被数字化,出现了《四库全书》、《国学宝典》、《中国历代碑刻》等大型古籍全文检索数据库。
由于古籍文献具有内容丰富、规模庞大、形式多样、无版权纠纷等特点,十分有利于数字出版。特别是大型古籍数据库的建成,为近几年迅速发展的数字出版业提供了一个良好的实验园地。《2007—2008中国数字出版产业报告》统计,全国数字出版产业收入规模2006年为200亿,2007年为360亿,2008年预计将达到530亿,数字出版在今后几年内还将保持着高速增长的态势。一些出版集团和文化公司纷纷加入到数字出版行列,数字出版进入了一个万马奔腾的良好局面。上海世纪集团数字化起步较早,先后在十多个方面进行过商业模式的探索。广东出版集团2008年成立了“广东出版集团新媒体出版中心”;中国出版集团投资100万元组建了“中国出版集团传媒有限公司”,此外,四川、湖南、辽宁等出版集团也都在数字出版方面进行了许多探索。北京国学时代文化传播有限公司经过多年努力,完成了“大规模古籍自动排版系统”,依托《国学宝典》大型古籍数据库,较好地解决了简繁体转换、超大字库、版式转换等难题,将排版速度提高了10倍,排版成本下降了80%,使个性化出版从方案变为现实,标志着出版数字化进入了一个新阶段。
在古籍数字化欣欣向荣的同时,我们也看到,古籍数字化缺乏一定的引导,在数据质量、数据内容等方面存在诸多问题,主要表现在如下几个方面:一是缺乏统筹规划。国内的古籍数字化工作缺乏一个全国性的权威机构的统一指导和协调,开发单位各自为政,出现许多重复建设现象。
二是质量参差不齐。古籍数字化成果虽多,可质量却参差不齐。除已得到公认的几种外,很多中小出版社、中小公司的产品,质量没有保障。
三是急需统一标准。现在许多单位设计数据库时采用的标准不一致,数据无法进行交换,无法真正实现国家乃至世界范围内的资源共享。
四是复合型人才缺乏。在古籍数字化过程中,*重要的工作是要在录入文本前对古籍进行整理,目前,从事古籍整理工作人才非常少,特别是既具备古籍整理知识又能熟练应用现代信息技术的高层次人才更为匮乏。
“千里之行,始于足下”。古籍数字化任重道远,古籍是中国的,是古老的;数字是世界的,是年轻的。希望两者的结合可以探索出一条传承中华文明的创新之路。