第二节 特色数据库开发与建设
自建特色数据库是当代图书馆开展的一项很重要的业务,主要是利用馆藏资源,建设在图书馆内或在网络上提供开放利用的数字资源库。
在公共图书馆领域,对自建特色数字资源库产生重大影响的是两项国家工程,即共享工程与国家数字图书馆工程。共享工程启动于2002年,2006年开始实施以项目申报方式推进数字资源建设,它不仅是数字资源库的建设平台,同时也是数字资源的推广与使用平台。国家数字图书馆工程启动于2005年,其目标是希望在数字信息时代建设世界上最大的中文数字信息保存基地,通过数字资源生命周期的技术支撑平台为全国,乃至全球提供高质量的中文数字信息服务基地。在这一设想中,国家图书馆是服务中心,各大图书馆是服务节点。根据数字图书馆推广工程的总体规划,“2011年至2012年是基础建设阶段,目标是完成所有省级和部分市级数字图书馆的硬件搭建平台工作,与此同时,与国家数字图书馆实现网络对接与资源整合,初步构建一个服务于全国的数字图书馆网络体系。……2013年至2015年是全面推广工程实施阶段,经有效地实施部署,推动了各馆的数字资源建设工作”。
在高校图书馆领域,自CALIS(中国高等教育文献保障系统)全国高校专题特色数据库项目启动实施以来,为高校图书馆特色数据库建设提供了强有力的保障,地域特色数据库在这股东风中获得了很大发展。仅以福建省高校图书馆为例,截至2017年6月,共有16所高校图书馆建设了40个闽台地域特色数据库,其中厦门大学图书馆建有“东南海疆研究数据库”“区域研究文献数据库”“闽台族谱数据库”“莆仙妈祖地方文化特色库”“台湾文献联合目录”等5个,华侨大学图书馆建有“福建戏曲文献资料库”“华侨大学图书馆馆藏港台图书全文数据库”等2个,福建工程学院图书馆建有“闽台建筑文化专题数据库”“林纾文化研究专题库”等2个,福建农林大学图书馆建有“福建省主要造林树种特色数据库”1个,集美大学图书馆建有“陈嘉庚研究数据库”1个,福建中医药大学图书馆建有“闽港澳台中草药图谱数据库”“闽台中医药特色数据库”等2个,福建师范大学图书馆建有“馆藏福建省三十六种新编地方志人物传记目录”“馆藏港澳台书目数据库”等2个,闽江学院图书馆建有“闽都文化数据库”“三坊七巷数据库”“福州非物质文化遗产数据库”“海西地方财政数据库”“海西服饰文化数据库”等5个,宁德师范学院图书馆建有“畲族与地方文献数据库”“宁德师院地方文献特色库”等2个,泉州师范学院图书馆建有“馆藏地方文献数据库”“闽南与台湾地方文献目录数据库”“泉州运动鞋类数据库”等3个,闽南师范大学图书馆建有“闽南文化地方特色数据库”“闽方言”“闽台生态农业库”等3个,三明学院图书馆建有“客家文献数据库”1个,莆田学院图书馆建有“妈祖文化资料库”“莆仙戏资料库”“莆仙地方特色数据库”“莆仙古代名人录”等4个,福建船政交通职业学院图书馆建有“船政文化特色库”1个,泉州经贸职业技术学院图书馆建有“泉州古代经贸文化研究”“泉商研究”“李光地研究”“泉州经济模式晋江经验研究”等4个,福建林业职业技术学院图书馆建有“福建省重点保护植物库”“福建省古树名木数据库”等2个。可见高校图书馆在地域特色数据库建设上的兴盛。
鉴于笔者供职于浙江省嘉兴市图书馆地方文献部,自2011年起即主要参与或负责地域特色数据库建设,所以,本节主要结合嘉兴市图书馆自建地域特色数据库的情况进行说明,提示自建数据库过程中需要注意的事项,为各馆自建特色数据库提供借鉴。
一、嘉兴市图书馆自建地域特色数据库整体情况
嘉兴市图书馆自2009年至2017年,建设了6个比较大的自建特色文献数据库。在2009年之前,建设有“烟雨楼史话”“范蠡湖诗词选”“嘉兴记忆”“嘉兴辛亥革命史料”“嘉兴自然灾害年表”“嘉兴槜李谱”“鸳鸯湖棹歌”“文物精品”“民俗民间文化”“名人故居”“文保单位”“古城风貌”“嘉兴南湖”“嘉兴文史资料”“嘉兴院士”“马家浜文化”“端午民俗文化节”“历代嘉兴藏书”“嘉兴五十年”“五姑娘音乐剧”“氏族”“百年嘉图”“嘉兴非遗名录”等23个小型数据库,合计29个特色文献数据库,择要叙述之。
1.“南湖文献”数据库
“南湖文献”数据库收集资料品种多样,内容丰富。种类涉及历史地理、诗词曲赋、鸳鸯湖棹歌、散文笔记、碑拓、南湖书画、图片、南湖视频、人物传记、中共一大南湖会议资料、南湖革命纪念馆等,共计文字63万字,图片2000余幅,影像5GB,是有关南湖文献的集大成者。其中收录历史地理文献145篇,诗词曲赋1067篇,鸳鸯湖棹歌1923首,散文笔记56篇,人物共计538人,碑拓资料54幅,碑拓注释文字92000字,南湖革命纪念馆的珍贵墨迹64幅,近现代名人颂咏南湖的书法墨迹131幅、绘画作品189幅,中共一大南湖会议相关资料128篇。“南湖文献”数据库注重特色资料收集,鸳鸯湖棹歌便是其一。鸳鸯湖棹歌是嘉兴古代诗人以风土人情作为诗歌创作题材的诗歌,有谭吉璁、陆以諴、张燕昌、马寿谷、朱麟应、庄一拂、吴藕汀、沈侗廔、单培根、许楼山、苏焕镛、陆翔熊等人所唱和朱彝尊的《鸳鸯湖棹歌》,蔚为壮观,且流风遗韵绵延数百年不绝,在嘉兴诗坛上形成一个特殊的流派。除此之外,在搜集资料过程中,注重全方位收集资料,收录有南湖纪录片、南湖影像、人文南湖讲座等视频资料;收录有名人所绘烟雨楼、南湖等的书画作品;收录有南湖风情照片,如南湖船娘、南湖采菱、南湖龙舟竞赛等相关南湖民俗等摄影资料,文献资料丰富,内容饱满、生动,具有重要的文献价值。“南湖文献”数据库是查阅和研究嘉兴南湖的必要学术工具。
“南湖文献”数据库
“南湖文献”数据库所收录资料都经过认真考订、校对。所收录的历代记、疏、序、跋、传、铭,皆来自嘉兴市图书馆自印资料或馆藏珍贵古籍文献。谭吉璁、陆以諴、张燕昌等人所唱和《鸳鸯湖棹歌》对照馆藏乾隆四十年(1775)朱芳衡写刻本仔细辨认异体字、讹体字,经过认真识别、考订和校对;单培根、许楼山所唱和《鸳鸯湖棹歌》是作者手稿本,弥足珍贵;《烟雨楼志》(清代朱稻孙著)对照馆藏1958年倪禹功手抄本认真校对、整理。碑拓文献经过文字释读,且逐条注释、考证之后加以引用,保证了学术的严谨性和准确性。
数据库注重资料原始性、科学性,文献图文并茂。利用珍贵馆藏,图文展示文献。如《鸳鸯湖棹歌》《烟雨楼志》《鸳鸯湖小志》《南湖碑拓》皆是图文并茂展示;南湖书法、绘画、领导人手迹等皆经过整理、编纲、分类、扫描,以图片形式上传;南湖影像经过实地摄像,以存当代影像文献。资料原始性强,文献价值高。同时,保留所收录的珍贵书影上的题跋、识语、批校、藏章等,利于读者欣赏和利用。
数据库收录注重版本价值。数据库收录同一文章,涉及不同出处的,一概全部收录,这样方便读者对照不同版本文章的差异性,诸如内容的增删、修改、变化等,以利用不同版本的流转价值。
数据库可根据文献标题、文献内容、作者、来源进行检索查阅,方便、快捷。
总之,“南湖文献”数据库的建设坚持高标准、严要求,完成了对南湖文献的发掘、考述和整理,内容丰富,编排科学,符合学术规范和要求,是查阅和研究嘉兴南湖的必要工具,对推动嘉兴南湖文化研究起到重要的作用。
建设时间:2009年9月—2011年7月
2.“嘉兴血防史资料库”
嘉兴的血防历史是我国血防史的典型代表,它反映了血防工作的艰辛及全国血防工作的几个重要阶段和主要事件,产生了具有重要影响力的血防专家和一批不畏艰辛、长期在基层工作的血防医务工作者(绝大部分人曾感染过血吸虫病,很多人死于血吸虫病感染),总结了在国际上也具有一定先进性和代表性的防治成果。
“嘉兴血防史资料库”通过现代技术将血防史资料汇集起来,再次完整地展现在今人面前。主要分为“血防概况”“血防文献”“血防人物”“典型病例”“血防大事记”等五大子库。其中最有特色的部分集中在血防工作者所收集的原始资料,包括工作笔记、书信、病人治疗资料、临床报告、实物、标本等,以及后来经整理出版的书籍文献资料和媒体报道等。该数据库不仅将现有资料收集入库,对文献资料进行数字化处理,对原始档案材料数字化及录入;而且将主要的工作集中在“口述嘉兴血防史”的制作上,由经历过血防的当事人讲述血防历史,以拯救性的态度,将这段记忆保存起来。“口述史”是该数据库的一大特色,以此作为原始档案、书籍等文献的补充。
“嘉兴血防史资料库”
该数据库建成的主要意义在于:一是对血防历史的铭记,向血防工作者致敬,弘扬血防精神,保卫人民生命健康;二是保存血防史记忆,这既是嘉兴地方史的重要方面,也是我国血防史的一个缩影;三是传承先进的血防技术和经验,是中华人民共和国防疫史、医疗史发展的典型案例,其在医学上的意义,也将对医疗工作者的研究工作产生启示;四是告诫今人,切不可放松对血吸虫病的防治,在今天,仍存在着新感染的血吸虫病人,也存在着复发的血吸虫病人。
建设时间:2011年3月—2013年6月
3.“嘉兴古代名人”数据库
“嘉兴古代名人”数据库收录了唐代贤相陆贽,明代收藏家项元汴、文学家李日华、才女柳如是、杰出画家项圣谟、文学家曹溶,清代文宗朱彝尊、秀水诗派创始人钱载、金石家张廷济、外交家许景澄、大儒沈曾植、国学大师金蓉镜、海上画派大家蒲华等文化名人约50人。内容包括这些人物的基本资料(生平事迹、年谱或年表),手稿墨迹,主要成果或作品(包括文字或绘画等),成果资料集成,历代对该名人的研究成果等资料,集文字资料、原始档案、视频、照片等于一体,内容真实、全面,具有科研参考性及研究性。数据内容在6GB左右。
建设时间:2012年6月—2013年6月
“嘉兴古代名人”数据库
4.“嘉兴运河文化”数据库
京杭大运河嘉兴段位于太湖东南的水网地带,是杭嘉湖平原水系的干河,也是京杭大运河自北而南沟通五大水系中的太湖和钱塘江两大水系的主动脉。大运河嘉兴段干道长约110千米。其中,目前的嘉兴段运河主河道以嘉兴环城河为中心,北苏州塘(苏嘉运河)接江苏,南杭州塘(嘉杭运河)连杭州,长81.22千米。另有元代以前的运河主河道崇长港、上塘河,长29.5千米。运河经过嘉兴市本级、桐乡市和海宁市,其中市本级40.8千米,桐乡43.87千米,海宁27.4千米。大运河嘉兴段从北至南包括苏州塘、嘉兴环城河、杭州塘、崇长港、上塘河等河道。大运河的开通,打破了嘉兴长期偏于江南一隅的封闭状态,确立了嘉兴“左杭右苏”“南北通衢”的运河古城地位,促进了嘉兴地区经济社会的发展。尤为可贵的是,历经2000余年的持续发展与演变,以明清运河主河道为骨干,各历史时期的运河干道并存,其网状河道体系至今保持畅通,一直发挥着重要的交通、运输、行洪、灌溉、输水等作用,是孕育嘉兴的“母亲河”,是活着的、流动的重要文化遗产。
“嘉兴运河文化”数据库
2014年6月,嘉兴市图书馆启动了“嘉兴运河文化”数据库建设项目,至2015年8月基本建成。全库收录了与嘉兴运河有关的图书、期刊论文、图片、音频、视频等多种类型的资料。该库的建设,得到了嘉兴市非遗中心的大力支持,提供了“嘉兴船民口述史”的文字整理资料。该库所收录的资料,除嘉兴市图书馆馆藏外,其余多由嘉兴市文化局、嘉兴文物局、嘉兴博物馆、嘉兴市非遗中心等单位提供。
建设时间:2014年6月—2015年8月
5.“嘉兴方言库”
嘉兴作为吴语区的核心区域之一,有着鲜明的方言特色。嘉兴方言属于吴语区沪苏嘉小片,是浙北吴语中的一种重要方言。该数据库的建设目标为保存嘉兴方言文化、方言读音、民间俗语、民间故事等内容资料。将与嘉兴方言有关的资料集中到一个数据库中,保存嘉兴地方文化,方便检索与利用。亦可以用于新居民学习嘉兴方言,培养方言的听说读写能力。该库首先利用嘉兴市图书馆纸质与电子资源、网络资源,其次与嘉兴市文化馆等机构合作,收录有关嘉兴方言的相关文字、视频、音频资料。并约请了两位方言纯正的本地老人陈雄明、徐美英,录制了两天的方言音频,使得该库的资料更为鲜活、丰富。
“嘉兴方言库”
建设时间:2016年9月—2017年3月
6.“记忆嘉兴——杜镜宣先生老照片”数据库
杜镜宣先生于20世纪50年代末从专业飞行大队转业到嘉兴,一直都在宣传部门和新闻媒体工作,曾是我国第一代航空摄影员、《杭嘉湖报》摄影记者、《嘉兴日报》记者,是中国摄影家协会会员,其摄影作品多次获奖并在《人民日报》《中国日报》等有影响的国家级报刊发表。他的摄影作品大都摄于20世纪,给人们留下了记忆中老嘉兴的美好回忆。
“记忆嘉兴——杜镜宣先生老照片”数据库
该数据库共分为五大部分,分别为“嘉禾风光”“街巷旧影”“时代印记”“履痕处处”“知青岁月”。同时,该库提供了较为完备的检索功能。
建设时间:2012年9月—2013年9月
二、自建地域特色数据库经验谈
1.重视选题
自建地域特色数据库的选题很重要,甚至可以说是决定一个自建地域特色数据库好坏成败的关键所在。一个平平无奇的选题,会让人觉得这个数据库的建设没有意义。一个好的选题,则会让人对数据库建设倍加期待。而且,选题要能够与当地历史文化、当地特色结合起来,才是一个比较好的选题。近年来比较常见的选题,如“名人库”“方志库”,都是属于与本地特色结合得比较紧密的选题,当然,也因为太常见而不容易出彩。选题还要注重覆盖面与深度的问题。比如“嘉兴古代名人”数据库,只力求在覆盖面上做到尽量齐全地收录相关名人资料,对每位名人却不可能有太多的篇幅介绍。而如嘉兴市图书馆正在建设中的“吴镇研究资料库”,就一定要在深度上进行挖掘,广泛搜集方方面面的资料,不但要在全国范围内搜集资料,甚至要在全世界的范围内搜集资料。
2.技术平台选择
确定好选题之后,就是搭建技术平台了。一般有三种选择:一是本馆自己搭建技术平台;二是采用上级馆的技术平台;三是采购第三方商业数据库公司搭建的平台。三者各有利弊。
采用本馆自己搭建的技术平台,好处是方便管理,技术人员对平台熟悉,一旦访问出了问题,能够很快定位到问题所在,并及时解决问题,不需要向第三方求助。弊端是对本馆技术人员的技术水平要求相对较高,要求具备数据库平台搭建技术,以及提供相应的技术支持。
采用上级馆的技术平台,比如市级图书馆可采用省级图书馆的平台,好处是比较省心,建设完成之后就交由上级馆统一负责管理和维护,本馆的技术人员相对要轻松很多。弊端是管理权不在本馆自己手中,一旦数据库出了问题,需要先向上级馆反映问题,多次沟通之后才有可能解决问题,比较费时费力。
采用第三方商业数据库公司的平台,如超星、CNKI、维普、万方等比较大的商业数据库平台,好处是较为省心省力,而且可以把一部分数据库建设任务外包给数据库公司,比如文字录入、文献数字化等。弊端是所需费用较高,商业公司所开发的技术平台,其采购费用和管理服务费用都比较高,需要图书馆有较强的财力支撑,而且本馆技术人员对第三方公司的管理后台不熟悉,维护起来比较困难,一旦出问题,沟通解决也是比较耗时的。
3.做好项目管理
作为一个自建数据库的实际负责人,更多地是承担项目经理的工作。他要能够随时随地关注整个项目的进度情况,以及每位成员的进度情况,如果哪个环节出了问题,要能够尽快解决这个问题,使得项目能够继续顺利推进下去。因此,高效项目管理的几个要点,在地域特色数据库建设中也同样适用:
(1)明确且达成共识的项目目标。确保项目的每项工作都是在为实现这个目标作贡献。
(2)精细化的任务分解。要点是每个单独的子任务时间不要超过一周,要有明确的子任务目标、时间节点、交付物。
(3)有时间保障且有能力执行的资源分配。有些项目虽然分配了资源,但不能保障资源的有效投入,这就是项目不能推进的非常重要的原因。
(4)每日检查、每周检查项目进展和交付物。
(5)根据检查情况调整任务目标、资源投入、项目进度,并修改计划。
4.验收答辩工作
在确认自建数据库建设完备之后,就要进入到验收答辩环节了。需要提前做到对数据库资源了如指掌,并多次确认重要的功能比如检索功能能用好用,精心准备答辩PPT,在介绍完项目之后,冷静面对专家的质询,做出合情合理的解释。如果确实有做得不到位的地方,要能够及时整改。在整改完成之后,要及时反馈给上级主管部门。
5.注意版权问题
在知识产权越来越受重视的当下,自建数据库时一定要高度重视知识产权问题。具体需要注意的地方有:收录到数据库里面的每一条资料,都要做到注明出处,最好把作者、来源、出版时间、页码等信息全部注明,同时确保自建数据库的使用是完全没有任何营利目的的公益行为;另外,如果确定收录了比较多的版权不甚清楚的数字资源,想避免纠纷,较为保险的做法是仅在图书馆内提供使用,不在网络平台上面向大众开放,这样就属于公益机构的合理使用行为,而不构成侵犯知识产权。
总之,自建地域特色数据库工作是一项系统工程,一般需要古籍地方文献部、信息技术部、数字资源部等多个部门的通力合作,互相配合,才能打造一个比较理想的自建数据库。在自建数据库的过程中,有许多需要注意的问题,如果能在规划和建设阶段都注意到,将为后续的使用带来很大的便利。