注:此图由德国Book2net古籍扫描仪扫描
质量:
· 图像后台加工过程
古籍扫描仪:古籍数字化,从本质上说也是对传世古籍的一种整理,不过是整理的手段、成果的形式与传统有别而已。古籍在数字化的“整理”过程中应该贯彻什么样的原则?20世纪末,国内有学者提出了“保真原则”和“整理原则”相辅而行的思想。它是在总结我国古籍数字化实践经验基础上形成的一个重要理论原则,对数字化古籍如何形成*终产品有理论指导意义。
所谓“保真原则”,是说数字化古籍产品应该具有“文物存储性”,具有重现作为历史文物的古籍原貌的功能,具体表现是数字化古籍产品应该形成数字图形版。数字图形版主要满足版本研究、文物鉴赏、书史研究、文字校勘、原件对照等特殊需要,可以认为是印刷版阶段“影印本”的数字化。在今天,实现数字图形版不存在技术上的障碍,只要对纸质信息进行照相或扫描并有足够的存储空间即可。所谓“保真原则”与“整理原则”相辅而行,主要包括以下几层意思:首先,以形式保真为主要任务的数字图形版不排斥适当的整理加工。比如检索工具和辅助阅读工具的添加,对原件的放大或缩小,页面颜色或背景的灵活改变等等。这种整理加工,正是数字化古籍之优势。不过,它应该被限定在“非内容性”的范围之内。其次,以内容整理为主要任务的数字文本版追求内容上的保真,而不是形式上的保真。这里涉及到的一个重要问题是对古籍用字的整理。为什么古籍用字数量庞大?重要的原因是异体字、古今字、通假字、避讳字等现象的大量存在。如果追求对所有这类字形的保真,汉字字库恐怕永远难以满足需要,同时对一般的利用者来说,实际意义也不大。其实,字形整理原本就是古籍整理的题中应有之义。“由于古籍用字的非规范性,决定了现代古籍整理在字形转换上的非保真性”[8]。所以,改正错别字、恢复避讳字、整理异体字等工作,本来就是现代古籍整理应做的工作。这样做,从形式上看没有保真,但从内容上看,却保留了原作的“语言事实”,消除的只是“文字障碍”。所以,古籍的数字文本版应该用“整理原则”指导保真,让保真服从整理,而不是以牺牲整理为代价去追求形式上的保真。第三,作为数字化古籍的*终产品,应在数字图形版和数字文本版之间建立紧密的联系,使文本显示和图形显示能够灵活切换,并且能够迅速准确地定位转换,以便于利用者作文本间的比勘对照。如果和印刷版阶段的古籍整理成果相类比,贯彻“保真”和“整理”相辅而行原则的数字化古籍产品,实际上是将“影印本”和“整理排印本”合一,这是充分张扬数字化产品优势的举措,它不仅给不同需求的人带来了利用上的方便,而且为古籍保存、善本留真开辟了新途径。目前,国内已经出现的数字化古籍产品真正全面体现“保真”和“整理”相辅而行原则的并不多,有代表性的是文渊阁《四库全书》电子版,其他大多还停留在单纯数字文本版或单纯数字图形版的地步。唯其如此,明确这一原则才具现实意义,它为今后的数字化古籍产品指明了发展方向。