| 南图概况 | 馆内游览 | 网上资源 | 馆藏资源 | 活动通告 | 论坛 | 支持我们 | 返回主页
 年  期
首页 > 组织机构与出版物 > 新世纪图书馆 > 网络天地

组织机构 读者信箱

  

网络数字资源库建设研究

第26期

耿 健(南京图书馆)

  【摘 要】 论文根据《江苏文化》大型数据库群建设的经验和体会,对数字资源库的结构、选题、调研、策划组织作了较深入的探讨,并讨论了数字资源建设中TRS全文数据库软件的应用问题。
  【关键词】 数字资源; 数据库建设; TRS

  【Abstract】 Based on the experience in developing the large scale data-base Jiangsu Culture, this paper explores the construction, subject choosing, investigation, organization of databases and then expounds upon the application of TRS system in database development.
  【Key words】 Digital resource; Database construction; TRS

  数字资源建设是一个复杂的系统工程,涉及多个业务和技术环节,需要参照和遵守相关的标准、规范和规则,同时还要注意解决好知识产权问题。我们参照全国文化信息资源共享工程资源库建设的要求,结合TRS软件相关技术环境,进行了《江苏文化》大型数据库群的初步建设。数字资源建设流程的总体框架,是在充分调研的基础上确定选题,根据选题做资源库的策划,并将策划提供给技术人员搭建环境,再由资源加工人员进行加工生产,然后将加工的资源交由质检人员审核,最后将符合要求的资源提供服务。


1 网络数字资源库的选题


  南京图书馆确定做《江苏文化》数据库主要基于以下两方面的考虑:一是南京图书馆是江苏省馆,有提供最全面的有关江苏文化的数字资源的责任。二是南京图书馆承办了江苏文化网。该网站是国家和江苏文化信息资源共享工程的展示平台,更是具有江苏地域特色文化资源的加工发布中心。这都需要有强大的数据库做支撑。
  江苏有着深厚的文化底蕴,在六千多年的历史进程中,形成了吴文化、古汉文化、淮扬文化、金陵文化等,也抚育出一大批文学大家,且南京图书馆有着丰富的馆藏资源,特别是在民国文献资料方面,也算得上是国内为数不多、保存最为完整的省级公共图书馆之一。为了将这些资源进行整合,同时配合江苏建设文化大省的需要,我们选择制作了文化旅游、名家名作、地方戏曲、地方文学、讲座、文物博览、法律法规、中国近代文献图库、文化周讯、文化名俗等主题资源库。每一主题资源库就是一个选题,其下又包涵若干子选题,工作人员可在已有选题中选择某一点新增大量资源,将内容做细、做深。


2 网络数字资源库的素材与资源调研


  确定选题之后,根据所选定的资源建设主题,对资源的来源展开深入调查,掌握资源数量、分布情况、原始形式、资源品质的具体信息,从而提出素材收集、数字化及处理的实施方案。在素材与资源调研的同时,对选题的某些细节也可进行修正。这里所提到的调研对象主要针对原始素材,其中包括原生数字资源(包括数字图片、音频及视频等)以及传统介质的资源对象(照片、图片、录音带、录像带、VCD、DVD等)。
2.1 用户调研
  根据自身资源内容的实际情况,分析目标用户群,可以把目标用户群按年龄、性别、职业或特殊群体进一步确定下来。
  本资源库是基于Internet面向全球提供访问的,其目标访客分为两类:一是作为科学与文化普及对象的普通访客,各年龄段的人均有;二是与各栏目知识内容相关的专业学习与研究人员,主要是向其提供全面的基础知识及特色资源。
2.2 功能调研
  制定功能需求调查表,选定一定范围的目标用户进行调查。通过对一些目标用户的访谈或问卷调查,了解他们的需求,通过样本的统计分析,结合资源建设单位的技术力量,进而知道我们将能为他们提供哪些服务,针对这些服务我们需要进行哪些功能设计。在对用户需求详细调查分析的基础上,结合素材本身的特点,设计资源库结构,确定资源组织方式和用户使用形式。
  本资源库主要提供技术功能、教育功能以及服务功能。
  技术功能具有分类准确、结构清晰的导航功能;针对特色资源库设置多途径检索和高级检索途径;能够形象地揭示内容主题、地理、空间的动画;具有有效揭示内容层次等级关系的结构树;能利用数字图书馆的技术与方法,有效地存储各类型信息资源。
  教育功能是通过传播文化知识和科学技术,达到教育全民、提高民族文化素质的目标。
  服务功能主要以丰富的内容为用户及文化事业的建设服务。


3 网络数字资源库的策划


  资源库策划具体包括素材内容策划、专题库群结构设计、子库结构设计、跨库关联体系的设计、发布形式设计和网站设计等。由于这个阶段尚未进入实际的加工制作过程,因此上述策划工作成文的方案只能起到为资源建设搭建概念框架的作用,但资源库的内容、结构和发布的具体实施方案均源自这一环节,所以需要资源策划人员将各种因素做通盘、周全的考虑,避免细化方案时对总体方案频繁改动,造成人力、物力上的浪费,或导致数据混乱。
  《江苏文化》资源库的组织结构根据信息内容的关联关系不同而分为两种,即跨库关联型资源库与非跨库关联型资源库。
  跨库链接型资源组织的结构特征是主体资源库(以下简称“主库”)+相关资源库(以下简称“相关库”),以文化旅游资源库示范。主库:旅游资源库,相关库则分为:文化民俗子库、人物子库、事件子库、土特产品子库、作品子库。主库可以链到各个相关库,各个相关的库之间也可以关联,各个子库也可以与主库进行关联,这样就形成一个网状结构,通过这种组织方式,建立基于旅游为资源内容的知识网络和知识中心,这是一种典型的数字图书馆模式,其特点是通过字段链接和多行文字中的置标实现库与库之间的有机联系,资源内容关系复杂,主库与各相关库之间联系密切,内容链接的表现形式灵活,组织加工难度较大。
  非跨库链接型资源组织的结构特征是∑与主题相关的资源库,以法律法规库示范,相关库:政策法规库、判例库、人物库。其资源组织的特点是通过页面栏目设计组织内容,每个子库服务于一个主题,彼此不做链接;资源内容简单,关系松散,内容增减较灵活,加工难度小。


4 TRS DProcessor数据库全文检索软件的应用


  TRS DProcessor是以数据层、业务逻辑层、表现层三层体系结构开发的软件系统,能很好地满足分布式数据管理的要求。在数据层同时兼顾了关系型数据库和文档型数据库的访问接口,满足各种数据类型的处理要求;在业务逻辑层支持Javabeans/ADO COM组件技术,具有很好的可扩展性、可伸缩性和安全性。不足的是TRS DP的加工有些烦琐。
  在技术支持过程中应注意以下几方面问题:对原始数据按照工作需要进行必要的加工后,必须保存,(即:保存最终素材);使用TRS DP进行录入时,加工人员使用统一的用户名和密码登陆,注意需在录入者字段内写入自己的真实姓名,以便系统统计每个用户的加工日志,每个用户对自己输入的数据负责;根据各人工作的需要,给予各资源库的使用权限,禁止使用与自己工作无关的资源库;禁止对资源库中的数据进行删除、修改,必须进行以上操作时,需与原数据录入人员沟通并得到允许后方可进行;资源建设环境由专人负责统一配置,个人不得擅自更改,应采取必要的技术措施,加工人员不能自己更改配置信息;用于资源加工的专门服务器要由专人负责,统一管理,只分配给用户工作需要的权限,不能跨权限进行任何操作;资源加工人员必须具备一定的计算机操作知识,并经过严格的培训方能使用资源加工系统;系统管理人员需要对用户的权限采取严格的管理,避免无关人员操作数据库。


5 网络数字资源库的加工生产与发布


  加工生产分为试验性生产和规模化生产。在对数字资源建设不很熟悉的初级阶段,试验性生产不失为一种快速了解加工、发布全过程的途径,同时也是一种查缺补漏的手段,可以及时发现库结构设计上的缺陷和遗漏,判定发布形式设计的技术可行性。随着数字资源建设流程的成熟和完善,试验性生产实际上已经融入了规模化生产,结构设计和技术实现应在资源策划阶段考虑完善,杜绝在加工生产阶段随意修改结构的现象。
  资源库的加工生产可分为素材处理、建立库结构、资源加工标引、制作资源库模板、质量检查等过程。
  素材的处理包括两个方面,即素材的数字化及素材的整理与编辑。就是将所有预备加工入库的素材严格按照“资源库素材加工标准”中数字化格式要求进行数字化;数字化后经过验收的素材仍然是“毛坯素材”,合格的素材将进入归类、处理、编辑过程,不合格的素材将返回相关部门进行修改。
  资源策划人员参照资源库策划方案以及“元数据著录规则”,并根据素材采集的实际情况,设计、制作标准的“库结构文档”。库结构文档是技术人员及加工人员实施各项操作的指南。
  技术人员根据库结构文档使用相应的建库软件创建库结构文件,创建库结构文件时需要注意库结构文档中提示的字段必备、多值等属性。一旦库结构建成,要避(下转第49页)(上接第76页)免反复修改结构的情况发生。通常情况,只能追加或删除字段,不可修改,否则容易造成数据混乱。
  录入人员按照固定的库结构及著录细则录入数据。库结构文档中对于著录的细则要求有详细的描述,对选用的核心元数据项,应严格参照“元数据著录规则”中的要求制定著录细则,对于其他的元数据项应明确说明著录内容的范围及著录方法。
  将整理并编辑好的素材按照软件的操作步骤加工元数据和对象数据,而内容的标引包括给出内容的主题、分类,对关联信息的提取和置标,并应该做好必要的入库记录,以便日后验收数据和保留一定的管理信息。资源加工及标引工作应严格按照有关的“资源加工细则”中的著录细则逐步进行。
  为了使建成的资源库能够有美观的展示效果,我们需要制作显示数据的模版。首先制作一个设计好的发布页面,然后加入TRS置标和JSP语言使其能够动态读取数据库数据。
  资源库建成后,需要有对数据质量进行把关的环节。主要对文字、图片、音视频、链接的正确性,内容的完整性等进行质量检查,数据的质量检验采用抽检的办法。
  网络数据库资源的发布,需要考虑发布页面的总体框架设计、页面栏目设计、发布页面的美术设计及制作等问题。
  发布页面的总体框架设计主要考虑主体资源内容的结构化组织。页面栏目设计主要考虑专题与该专题下各资源子库之间的关系以及资源展示的方式,确定栏目的性质:跨库链接型资源库的发布形式,主库是信息发布的主角,突出主库资源内容的检索功能,其相关库作为辅助信息,通过主库内容的浏览一一展示,如文化旅游库;非跨库链接型资源库的主页形式,主页形式类似于常见的内容网站(例如:sina),所有库以栏目的形式在网页上展示,各资源库内容通过栏目分别浏览,检索功能地位不明显,如文化民俗库。发布页面的美术设计及制作主要考虑页面的色彩、图形、版式、字体、动画等。


6 结束语


  网络数字资源建设应根据图书馆自身的特点,从现实馆藏和虚拟馆藏两方面加强特色化建设,其特色的内容包括学科特色、地方特色以及本馆收藏特色等。同时也必须考虑到知识产权保护的相关法律,把握好数字资源利用过程中尊重著者权益和确保用户合理使用这两者的平衡。

(作者信息:南京图书馆信息资源开发部,邮编:210018。收稿日期:2006-11-28。)编校:刘勇定

 

苏ICP备05016133 版权所有©南京市成贤街66号南京图书馆 建议分辨率 1024*768