用数字化技术保护华文资源

发布时间:2019-11-13 22:49:15


技术的发展促使知识向通用的数字形式转变,从而更好地为人类服务。在日前举行的国际图书馆东亚文献合作暨华文报刊数字化研讨会上,来自世界各地的250余名图书馆馆长、汉学研究专家齐聚长沙,就图书馆馆藏华文资源的数字化、华文历史报刊文献数字化的现状及当前存在的问题进行了探讨。

推送知识服务读者

对于文字知识而言,数字化并不仅仅是将纸本图书扫描、加工成数字格式,数字化的知识不仅能扩大传播范围,更可以引申出新的出版模式。来自北京大学数据分析中心的李铎在研讨会上这样提出。

据李铎介绍,北京大学图书馆通过发挥计算机的功能,将古代文献进行大型数据分析、整合,已经使数字化的图书超出了原本纸质图书的知识范围。

“我们建立了阅读古代典籍文献的图书馆,可以模拟读者进入图书馆的情景,这样任何一个人在读任何一本书的时候,其他的书都可以当做潜在资料及工具书。”李铎在研讨会上谈到,北京大学图书馆目前已经实现了这种功能:当读者在数据库中读到某本书时,不需要输入任何文字,只要画一段话或某个字,图书馆就可以在背景中查找到相关知识。“比如你在某个成语下画线,计算机就会自动显示这个成语的来源、与之相关的故事,如果你对这个故事中某句话不理解,只要在这句话下面画线,系统还会继续显示背景资料,直到你完全理解。”

这种功能的实现建立在海量古籍资源及多种工具书的基础上。据介绍,北京大学图书馆先将海量数据分类整理,再基于数据分析进行知识重组,最终做到综合服务。

“北京大学图书馆建立经典知识文库的情况,已经不仅仅是图书载体的转化,而是给书中精细化的知识增加附加值。这不仅是简单加工,更是重新创作。”美国俄亥俄州立大学图书馆中文部主任李国庆这样评价北京大学图书馆的做法,并认为这对研究中国古代文献的人极为有利。

据悉,北京大学图书馆还建立了中国历代典籍总目的项目,该项目将中国古籍馆藏融为一体,由国家图书馆总投资,经过两年开发目前已推出1期项目,已经有240万条数据,古籍品种覆盖95%以上。

在这个项目中,北京大学图书馆还实施了知识推动的战略,更好地发挥了数字时代图书馆的知识服务作用。该项服务利用计算机背后的平台记录读者的读书轨迹,因此可以进一步对读者行踪进行分析,进而主动向读者推荐书籍。“这时图书馆的作用就不仅仅是被动地阅读,而是主动介绍图书,就可以根据读者特点实现知识推送的作用。”李铎这样说道。

古旧文献数字保护

除北京大学图书馆之外,斯坦福大学、伦敦大学、厦门大学、湖南图书馆等世界各地图书馆也介绍了各自的数字化进程,与会图书馆业内人士不约而同提到了数字化对古旧华文文献的保护作用。

“古旧文献作为传统文化的载体,起着传播文化的作用。但是,纸质载体容易被毁坏,而且传播范围有限。在信息技术高度发达的今天,采用计算机技术,对古旧文献进行数字化,制成古旧文献书目数据库和古旧文献全文数据库等,可以更好地揭示古旧文献的丰富信息资源,从而在更大范围内传播灿烂的传统文化,为深层开发和利用打下良好的基础。”湖南图书馆馆长张勇这样说道。

厦门大学图书馆特藏与数字化部主任刘心舜也表示,馆藏内容数字化主要还是为了保护现有的较易损坏的纸质资料。此外,针对那些稀有的、有较高文献价值的资料,刘心舜认为通过数字化能为读者提供更加便捷的使用体验。

与会专家还提出了现有数字化过程中的一些问题,比如历史报刊纸张破损、文字模糊的现象非常普遍,纸张发黄易脆,给扫描工作带来很大困难,以及当前数字化资源应用平台不够成熟,资源共享性较差的问题。

相对于古籍资源,中国的报刊更加需要数字化。自1815年首份华文报纸创办以来,华文报刊迄今已有了近200年的历史,由于历史久远及报刊用纸的特殊性,这些古旧的资源面临着消失的危险。就此,青苹果数据中心董事长唐五一也在会上提出了华文历史报纸文献数据库规划。据唐五一介绍,此举在于“抢救”华文历史报刊,让收藏百年的历史报纸重新面对公众,为了解和研究中国近现代历史提供丰富的信息源泉。

定位华文商业价值

数字化的过程需要耗费大量资金,当数字化之后,图书馆馆藏文献如何进行商业化运作?这也是国际图书馆东亚文献合作暨华文报刊数字化研讨会上一直被关注的话题。

“就图书馆华文数字化文献特性而言,商业化应用主要在整合性产品、文化加值产品等方面。”台湾中央大学博士后研究员陈俊湘在演讲时谈到,数字化内容应经过专业编排、系统化组织以供研究、教育及其他大众使用。并且此类产品目标市场应为各类图书馆、各级学校与出版单位。

在国外,各级学校、出版单位也一直是图书馆华文馆藏资源的主要需求者,美国国家人文教育技术应用研究院执行总裁约瑟夫·金在介绍美国华文文献数字化现状时提到,当前美国很多高校年轻教师都喜欢数字书籍,并且乐于使用数字资源与学生交流,而学生也大部分习惯了iPhone、iPad等数字设备,因此图书馆数字化资源仍有很大的开发价值。

“将数字化资源应用到教学当中,可以利用技术做一些长期资源积累,比如收集很多的数据资源让学生分类、研究,可以帮助图书馆省去资金。”约瑟夫·金这样说道。

但高校拥有的资金有限,尽管大多数图书馆对华文数字文献都有需求,其费用却不是中小型图书馆能够承受的。因此,现在通常使用的方法是数所学校一同购买文献,共同使用。约瑟夫指出,当前数字文献的价值并未被发掘出来。

未发掘的主要原因还在于现有图书馆机制结构的问题,陈俊湘提出,当前数字文献资源主要集中在公有机构中,与市场化的商业交易模式缺乏良好的沟通,报纸期刊数字化也因此遭遇推广应用上的阻碍。因此他建议,由第三方建立专业授权交易机制或许可解决困境。