图书馆古籍资源数字化建设探讨

时间:2022-11-16 08:37:16 关键词: 图书馆 数字化建设

摘要:尽管我国图书馆古籍资源数字化实践已有些年头,但建设仍缺乏统筹规划,存在版本与格式管理不规范、专业型人才不足、资源利用率低等问题。在信息时代,相关机构有必要对古籍资源数字化建设进行统筹规划,通过版本与格式标准化管理、构建专业型人才体系与多样化数字资源利用机制等措施,促进古籍资源数字化发展。

图书馆古籍资源数字化建设探讨

我国是一个历史悠久的文明古国,无数典籍文献成为中华文化绵延发展的“印证”,成为文化传承和创新的资源库,其对现代文化发展具有重要的历史意义。然而,由于经历了较长的历史变迁,众多古籍已经成为珍贵文物,受到图书馆、档案馆、博物馆、民间收藏家等机构或个人的保护,大众没有机会直接接触。在此种情况下,计算机和信息技术的介入,能够在保护古籍原貌的情况下,通过对古籍内容的数字存储和传输,提升古籍的利用率,促进古籍资源的广泛传播。我国古籍数字化探索始于台湾地区。20世纪90年代,台湾一些公立图书馆就开通了古籍书目的数字化检索功能,建立了古籍数据库,用户能够通过古籍信息平台获取书目信息。1997年,辽宁省图书馆率先建立起了涵盖3万多条信息的普通古籍书目数据库。之后,重庆市图书馆、国家图书馆、上海市图书馆等大型公共图书馆逐渐开展了古籍书目数据库和古籍数字化版本的建设,为我国古籍数字化工程做出了重大贡献。2008年,《古籍著录规则》以国家标准的“身份”成为古籍数字化的技术标准,成为包含家谱、舆图等多种古籍样式在内的古籍数字化统一规范,促进了古籍数字化工作全面发展[1]。在理论界,众多学者也开始对图书馆古籍数字化建设进行了探索,在古籍数字化建设和利用上提出了许多建议。梁爱民、陈荔京以数字图书馆推广工程为切入点,分析了我国古籍数字化在政策层面存在的若干问题,提出了古籍数字资源数据库建设的相关建议,并从古籍数字化与数字图书馆推广工程相结合的角度提出了融合发展思路[2]。高娟、刘家真通过实证调研的形式研究了古籍数字化技术发展和国际合作状况,分析了古籍数字化发展的主要制约因素和潜在风险,提出了以古籍数字化工程为核心的古籍数字化建设方向[3]。邵正坤指出,我国古籍数字化在版本、格式、系统、版权等方面仍存不少问题,需要从技术、政策等方面予以规范建设[4]。姜妮从载体形式和加工方式上进行了明确的古籍数字化分类,并详述了我国港台和大陆地区古籍数字化建设状况和发展程度,最后立足于古籍数字化发展实际,提出了我国古籍数字化发展建议[5]。本文基于现有研究成果,立足现实,试图分析制约图书馆古籍资源数字化建设深层原因,并在相关文献和理论的支撑下探讨图书馆古籍数字化建设与利用思路。

一、图书馆古籍资源数字化建设的阻滞因素

1.缺乏整体统筹规划

1997年辽宁省图书馆率先开展古籍数字化以来,经过20余年的发展,我国省级图书馆都开展了古籍数字化工作。不可否认,图书馆通过复印、扫描、电子识别等技术促进了古籍利用效率,取得了一定成效。不过从总体上看,此时的数字化存在重复建设和建设盲区问题,缺乏统一的、全局性的古籍数字化规划,这也导致古籍数字化工作在覆盖范围和推进深度上存在发展困境。一方面,图书馆都是按照自身需要开展古籍数字化工作,缺乏政府机构或行业组织的统筹协调,机构之间信息不通畅,多个机构重复建设同一古籍电子版的现象时有发生。如文渊阁《四库全书》电子版,就曾出现了包括武汉大学图书馆、岳麓书社等8个机构参与的3个电子版书目。虽然如此能够丰富古籍数字化市场,但是这些电子版书籍内容大体一致,带来较大的资源浪费。同一本古籍的多个数字版本也容易使消费者难以辨别与取舍[6]。另一方面,相比经典古籍,一些年代较为久远或受众群体有限的古籍则难以在选题和电子化方面获得图书馆或出版社的青睐。对于资料有残缺或者市场需求量有限的古籍,在市场机制的作用下,图书馆与出版商往往会选择回避,这些建设盲区不利于构建统一的数字化古籍数据库。

2.古籍版本与格式管理混乱

古籍在流传过程中很可能存在多个版本,不同的版本在语句、字符、排版等方面存在诸多不同。在古籍数字化过程中,对古籍版本如果不加辨别和筛选就会额外增加工作量。古籍的不同版本都有其特定价值,因而,在数字化建设过程中,图书馆有必要进行版本管理,但当前大部分图书馆没有进行有效的版本管理。有些图书馆即使建设了古籍数据库,也仅是将其纳入统计范围,未进行有效的标签化处理和多元化检索,难以真正识别古籍版本,难以实现快速检索。此外,由于我国古代缺乏统一的字符标准,古籍中存在着字符大小不一、字体变化多样等特点,因而难以进行标准化的字符识别;加之随着文字语言表达形式的变迁,一些古体字和异形字在当下已经停止使用,给数字化处理和现代传播带来一定的难度。依据我国GB2312-80字符集,众多古籍中的文字在计算机系统是不能自动识别的。当前,我国香港、台湾地区采用不同的字符集进行古籍数字化,但实践证明其在后期检索、共享时也极容易出现“乱码”现象,不利于传播。可见,缺乏一套标准化的处理流程,既不利于提升古籍数字化效率,也不利于更大范围的数据共享和资源互通。

3.专业型人才不足

古籍数字化是一项涵盖多个环节的复杂性工程,需要众多专业人才参与其中。图书馆在古籍数字化建设中需要历史考古、文学、图书情报等相关专业的人才对古籍内容进行把握,保障古籍数字化的准确性和合理性,减少电子化转换产生的数据失真。此外,在古籍数字化的过程中,图书馆还需要充分利用计算机科学和数据库管理技术,将原本以纸质或其他物理材质为基础的古籍通过数字化加工转变为可进行机器识别和检索的可视化数据内容,提升古籍的可传播性。因而,古籍数字化需要一批掌握古代文学、历史学、考古学的专家以及数字化工程师。然而,我国许多图书馆基本以图书管理人员为主,这些人员虽具备图书情报和信息管理的学科知识,但在文学、历史和计算机技术等专业领域缺乏相应的知识背景,难以从整体上把握古籍数字化工作。

二、图书馆推进古籍资源数字化建设的思路

1.加强古籍数字化建设规划

各图书馆、出版机构之间应当积极开展合作,通过合作实现古籍资源数字化共建。一方面,要建立古籍数字化行业联盟。可由全国图书馆、档案馆、出版组织、政府部门等机构共同组建古籍数字化工程统筹机构,并将其作为行业联盟的主管机构,对专业性较强的古籍数字化建设进行战略规划,明确古籍数字化建设进程、目标、建设周期、验收标准等内容。另一方面,在建设管理上,行业联盟应根据相关专业特性和发展阶段,制定项目的建设规划,引导各个参与机构依据自身的实力开展古籍数字化项目申报,并配备专业人才指导建设、反馈进度。建成后的古籍数据库作为建设机构的重要知识产权成果,行业联盟应进行相关专利申报和著作权保护,在授权管理和版权交易上给予必要的智力支持和担保,以提升行业内部的资源流动性。在古籍数据方面,图书馆也应建立明确的管理规划,按照学科、年代、区域等属性进行古籍数字资源分类,逐步完善各类型数据内容,以避免重复建设与建设盲区[7]。

2.增强古籍版本与格式管理

由于时代及信息流动的限制,古籍文献往往缺乏统一的样式,图书馆在古籍数字化建设过程中更应该增强古籍的版本与格式管理,促进古籍数字版本统一与标准化建设,增强古籍库的国内外对接,以适应网络共享场景。在版本管理上,图书馆应协调各个机构,开展版本统一和版本规范化工作,对多版本古籍归纳管理,提升版本识别效率;在格式管理上,图书馆应基于国家标准,对字符、字号、字形进行标准化转换。对于较为复杂的文字内容,图书馆可以通过简化、替代、标注等形式有效改造,提升该类内容的可读性,以便于大数据环境下的数据检索,降低古语言文字认知难度。同时,图书馆还应在相关语言学专家的指导下,建立古籍学习和教育的相关教程,普及古籍相关知识,以适应大量古籍数据库之下的深度古籍管理。此外,在版本与格式管理方面,我国大陆、港澳台地区最好能建立统一的机制。当然,由于管理机构和运行模式的差异,我国大陆、港澳台地区的古籍数字化统筹协调有一定的复杂性,未来应当积极引导民间机构联合开展相关的标准制定和数据对接工作,以实现资源共享与共同发展。

3.构建专业型管理人才体系

人才是图书馆古籍数字化建设的重要条件。第一,图书馆可以通过社会化招募,聘请一批计算机学、考古学、档案学、文学等方面的专业人才,并由这些人才担任相关专业领域的专家,对古籍数字化项目的可行性和建设标准进行整体把握,确保相关流程符合业内统一规范。第二,图书馆内部要加强相关专业知识的培训,通过定期开展讲座、经验分享、项目讨论、部门例会等形式,加强内部工作人员与相关专家的交流,建立完善的培训框架。第三,对整个古籍数字化建设项目的各个环节进行全员培训,争取让部分图书馆工作人员成为古籍数字化建设专业型人才,进而构建一支训练有素、本领过硬的管理团队。第四,充分发挥图书馆联盟的作用,建立起机构间轮岗、挂职交流等形式的人才流动机制,强化实践导向和结果导向,使部分图书馆工作人员能够在做好本职工作的基础上胜任古籍数字化管理工作。通过招募、聘请、培训、轮岗等多种方式,图书馆才能逐渐构建古籍数字化专业型管理人才体系,为古籍数字化持续发展提供保障。

三、图书馆数字化古籍资源利用建议

古籍数字化的实践已经历了20余年的发展,经过数字化处理后的古籍资源为古代文学和历史学研究提供了便利,但不可否认,目前我国所建立的古籍数据库利用程度偏低,主要表现为可检索程度低、使用效率低、共享平台缺失等方面。(1)在检索上,以关键词检索为主的检索模式没有考虑古籍上复杂字形的检索复杂性,在进行复杂字形检索时使得检索结果失真,影响实际检索体验和数据库管理。(2)古籍常用于文学、历史学、考古学等研究工作,由于相关学科与现实生活距离较远,一直属于偏冷门学科,相关研究人员数量有限,数字古籍资源的使用效率低,大量的数据资源成为少数研究学者的资源。目前,古籍数据库未能进入大众视野,也未能充分发挥其价值。(3)由于缺乏统一的管理机构,尚未建立资源共享与交易的平台,各机构在古籍数字化建设与利用的过程中也缺乏相应的沟通协调机制,建设机构、购买机构、租赁机构、服务机构等相关主体缺乏常态化沟通,整个古籍数据库利用过程处于孤立无序的发展阶段。随着现代信息技术的发展,共享成为互联网经济的典型特征。开展古籍数字资源的共享有利于扩大古籍数字化建设规模,提升古籍数字资源的使用效率,促进现代图书馆古籍数字化事业持续健康发展。因而,图书馆未来应不断推进多样化数字资源共享工作的开展,在检索技术、共享平台、服务平台上完善古籍资源利用机制。第一,图书馆要充分运用统一的版本标准和字符标准,建立以关键词语义关联检索为基础的检索模式,不断引进大数据、云计算等技术优化检索结果,并通过智能推荐和个性化服务等形式提升检索结果精准度,优化用户体验。第二,图书馆要建立古籍数字资源的共享平台,让资源的出版方、建设方、购买方能够在平台上进行广泛的信息传达与互动,以扩大古籍数字资源的交易规模,引导多方参与者通过平台开展广泛合作,提升整个古籍数字资源的商业价值。平台的建立和规则的制定需要全体参与者集体决策,应当确立部级的领导机构,并由政府部门牵头成立行业联盟,制定相应的风险分散和利益分配规则,保障资源共享的效率。第三,图书馆应做好古籍数字资源的推广工作,让那些蕴含中华传统文化与凝聚智慧的古籍进入大众视野。在“全民阅读”与“大力弘扬中华传统文化”的新时期,促进古籍数字资源的大众化利用,才能真正发挥古籍资源应有的价值,即全面的社会化推广是提升古籍数字资源共享广度与深度的有效路径。当然,古籍数字资源社会化共享还有很长的路要走,未来,随着微媒体的介入与移动互联网的发展,那些尘封的文字或许能重新焕发生机。

参考文献

[1]康尔琴.公共图书馆古籍数字化的实践与思考[J].图书馆工作与研究,2010(8):8-10.

[2]梁爱民,陈荔京.古籍数字化与共建共享[J].国家图书馆学刊,2012(5):108-112.

[3]高娟,刘家真.中国大陆地区古籍数字化问题及对策[J].中国图书馆学报,2013(4):110-119.

[4]邵正坤.古籍数字化的困局及应对策略[J].图书馆学研究,2014(12):32-34.

[5]姜妮.国内古籍数字化之解析与探讨[J].四川图书馆学报,2016(1):72-75.

[6]林竹鸣,朱翠萍.古籍数字化的历史、现状及问题探析[J].淮北师范大学学报(哲学社会科学版),2014(6):192-194.

[7]王雁行.以“中华古籍保护计划”为依托建设国家古籍资源数据库[J].国家图书馆学刊,2016(3):82-88.

作者:王江 屈红军 于瑛 单位:东北林业大学图书馆