知识服务型档案网站构建研究

作者:刘晓亮 更新时间:2010-11-09 08:49 点击:
【论文发表关健词】档案 知识服务 知识网络 知识组织
【职称论文摘要】
本文在分析档案网站与知识服务的基础上,阐述了档案网站知识服务的要求,提出了构建知识服务体系的系统框架,并对框架中档案知识资源建设层、资源整合层及服务应用层的实现思路与相关技术进行了分析探讨。

开展知识服务为档案工作的发展提供了机遇,也对档案工作提出了更高的要求。作为档案馆对外宣传、用户服务重要平台的档案网站更是需要适应知识服务的发展要求。伴随着档案信息化的不断深入,必须对知识服务展开研究,应用相关理论与技术对档案网站进行优化与改进。
  
  一、档案网站与知识服务概述
  
  目前,大多数档案馆都开设了档案网站,按时间、形成单位、主题词等特征对档案进行组织分类,提供Web浏览、检索、下载等功能,以此为档案用户提供网络服务。在这种服务体系下,档案形成了层级分明的组织结构,档案用户可以查询到自己需要的文件。然而,档案的历史价值是体现在文件之间的联系之中的①,仅以分类法、主题法作为档案组织方法,在组织结构上只能以一维或二维架构对文件进行组织划分,容易割裂文件间许多逻辑联系,不能从知识认知上为档案用户展示档案文件所记录的事物及其多种关系,大大降低了档案资源的利用效能。比如档案用户查阅某政策法规文件时,当前大多档案网站并没有以多维角度同时展现该文件的历史背景、颁布依据、修改变化以及相关的其他文件。而且档案网站缺乏必要的分析、综合等功能②,不能进行档案的系统调研、科学评价和决策支持,没有将文件中的知识联系与有效、潜在有用的能用于解决特定问题的知识充分提供给用户,与知识服务的要求有相当距离。
  知识服务是以用户为中心,以信息、知识的搜集、分析、重组为基础,根据用户的具体问题和个性化环境,把服务融入用户解决问题的全过程,提供能够支持用户实际需求的应用服务③。所以,对于档案用户来说,在使用网站时希望看到的不仅是层级分明的结构化文件资源页面,而且是能够根据其需求,提供多种角度查询、浏览及多种方式获取档案知识的多元化服务网站。
  
  二、档案网站知识服务的要求
  
  档案知识服务是建立在用户需求、专门知识和服务功能基础之上的一种价值取向,体现的是“用户”、“知识”和“服务”。构建知识服务型档案网站,需要突出以下几个方面。
  1.用户需求
  档案用户类型众多,不同的用户对文件信息的需求不同,历史研究者为研究某个领域,需要的档案内容面广、时间跨度长;而企业中的档案考证,要求查找非常具体、准确。档案用户使用资源的侧重点也不同,举个例子,城市建设档案数据库中,不同用户输入相同查询词‘建筑节能’,可能感兴趣的是建筑节能材料与建筑节能规划不同方面的文件。
  把握用户的信息需求,是开展深层次服务的关键。通过用户填写网站注册信息可以获知他们的偏好、兴趣等信息,但实际中大多数档案网站没有开设用户注册功能,而且用户需求是不断变化地,相当数量的用户不愿手工提供、修改注册信息,应主要通过用户的网站使用记录隐式地收集用户的需求信息④。档案用户访问网站时的查询、浏览等使用记录能够较客观地反映他们的习惯、需求特点,通过对这些记录进行分析与研究,围绕档案用户的需求有针对性地建设资源,设计档案组织方式与服务方式,把用户的需求融入档案知识服务的整个过程之中。
  2.知识挖掘、组织
  知识服务是面向用户的,以提供知识为目标的,构建知识服务型档案网站,需要将文件中的知识予以提取、挖掘、解释。知识元是构成知识结构的最小独立单元,是从文件中提取的定义、信息报道等对特定事物的具体描述⑤。将文件中的知识元进行抽取与链接,可以方便用户查找,降低其获取知识的难度。
  在组织结构上,不仅应以一维或二维架构组织文件,而且应同时站在用户与知识的角度对文件信息知识进行组织,利用多种组织方法结合用户需求将档案知识以多维方式表示、序化,为用户提供多种知识线索,帮助用户获取知识。
  3.多样化、个性化的服务
  档案用户信息需求的细化和深化,需要档案网站动态地适应变化需求和改变服务模式。档案知识服务必须保证原有基本的检索、资源导航等通用功能,满足档案用户的共性需求。同时,开设个性化、多样化的服务功能与方式,比如应用Web2.0中的Blog等相关技术丰富档案用户对知识共享、个性化的需求。通过有效的服务减少档案用户获取知识的成本,确保服务价值增值,让档案用户体会到服务的价值。
  
  三、档案知识服务体系构建
  
  档案网站知识服务体系主要分为知识资源建设层、知识网络整合层与知识服务应用层,如图1所示。知识资源建设层主要包括档案信息数据库、知识元数据库、知识库与用户使用记录信息库,为开展知识服务提供数据基础;知识网络整合层对各种数据源进行挖掘组织,将资源整合成具有多维知识联系的知识网络;知识服务应用层将档案中的文件及各种知识联系表示、展现、传递给档案用户,提供各种服务应用功能。
  
  1.知识资源建设层
  档案信息数据库按照元数据著录标准,比如EAD(档案编码著录Electronic Archival Description)标准,将文件的题名、形成时间、文种、载体、密级、主题词、正文等特征以元数据格式存贮。
  知识元库是由文件中抽取的知识元、知识元链接和描述构成的数据库。建立完备的知识元库是一项巨大复杂的工程,例如CNKI的知识元库中的知识辞典具有1400多万概念知识元。档案机构人力、经费有限,可通过增量方式从档案信息数据库进行知识元抽取,逐步建立知识元库。关键词汇的自动抽取可利用分词系统,比如中科院的ICTCLAS系统,其具有较成熟的分词、词性标注等功能,可以较容易地提取出人物、地名及其他关键词。但需要注意的是,分词粒度过小容易将所需的关键词切分,相反,不能切分出所需的关键词,仅通过控制分词粒度很难提取出所需知识词汇。通过填加用户词典可解决此问题,但这样不能提取出许多未知词汇,需要对分词结果进行词性、语法结构分析来合并被切分的词汇,例如:合并‘建筑/n 节能/vn’为建筑节能,减少提取的关键词与原文中词汇表达的语义损失或不符。知识元链记录知识元间在时间、顺序、因果、从属上的关系。知识元链可以手工标注,结合统计归纳、关联等技术自动分析实现。知识库主要根据知识元库与档案信息数据库建立而成,记录文件所包含知识元的不同排列组合⑥,可独立存在或嵌入档案信息数据库与知识元库。 (责任编辑:nylw.net)转贴于八度论文发表网: http://www.8dulw.com(论文网__代写代发论文_论文发表_毕业论文_免费论文范文网_论文格式_广东论文网_广州论文网)

发表评论
本站模板均经测试成功,请放心下载,遇到任何问题或者需要购买付费论文请联系本站。
表情:
验证码:点击我更换图片