知识服务型档案网站构建研究(2)

作者:刘晓亮 更新时间:2010-11-09 08:49 点击:
【论文发表关健词】档案 知识服务 知识网络 知识组织
【职称论文摘要】
用户使用记录信息库存贮用户访问网站时的输入流、点击流和用户的偏好、兴趣和身份认证等注册信息。常用的用户使用记录数据来源可通过Web服务器日志文件获得,日志文件具体地记录了用户的使用行为,每条记录描述了用户


  用户使用记录信息库存贮用户访问网站时的输入流、点击流和用户的偏好、兴趣和身份认证等注册信息。常用的用户使用记录数据来源可通过Web服务器日志文件获得,日志文件具体地记录了用户的使用行为,每条记录描述了用户对资源的请求时间、IP地址、请求的资源及相关参数等。经过页面访问识别、用户识别等预处理,生成主要包括访问时间戳、用户标识、查询关键词、请求的文件等记录信息。
  2.知识网络整合层
  知识网络整合层运用分词标引、自动摘要、关联规则挖掘、序列模式分析、分类聚类等技术对档案文件进行分析与挖掘,根据不同用户的兴趣、偏好等需求使用多种知识组织方法动态地为用户组织文件。其中,知识组织作为构建知识服务的一项关键环节,应主要从以下四个方面进行:
  (1)基本的信息组织。以全宗号、案卷号、题名、形成时间、关键词等基本特征及分类法、主题法组织档案,即以信息视角对档案进行组织,通常也是网站组织分类的基础架构方法。
(2)基于知识元链的组织。知识元链将知识元组织起来,按事物发生顺序、因果关系、引用关系、人物关系等逻辑联系组织起来,展现档案的内在联系。比如将某项政策规定的形成依据、变化、发展组织起来,为档案用户提供系统化的知识。同时,包含知识元的文件间也可形成连接,一起形成组织各种知识的逻辑联系。
  (3)基于文件内容重组的知识组织。使用数据挖掘方法对档案知识间的逻辑联系进行重组,对文件间的联系进行深度整合,挖掘档案中存在的隐性知识⑦。比如通过聚类算法,以人物、地点、事件、学科、查询词及文件所包含的知识元及其不同组合聚合,形成具有内在知识联系的文件集合;利用关联算法,挖掘文件中某些特征的共现模式,将具有模式中特征的文件组织起来,发掘档案间的知识联系。基于重组的方式随着网站中档案资源的变化,可动态地更新档案知识组织联系,并且能够弥补分类法、主题法造成的文件间逻辑联系割裂的缺点。
  (4)基于个性化的知识组织。不同的用户具有不同的知识结构与使用习惯,将用户的不同需求融入知识挖掘与组织之中,能够为用户提供更多有针对性的知识。通过对用户使用记录分析、挖掘能够推断出用户视角下的文件与文件之间、查询词与文件的关系,发掘档案用户个体对资源的应用模式,建立用户个人使用模型,以此针对用户的偏好、兴趣组织档案资源,比如不同用户相同查询词下网站提供的档案文件集合具有不同的内容或排列顺序。将具有相似查询词、访问文件等需求特点的用户聚类分组,建立社团模型。将全体用户作为一组,把用户最常用的文件、查询词组织起来,比如常见的按照文件点击率排行组织文件,建立全体用户模型。对于新用户,可以先根据全体模型进行资源组织,再根据访问记录逐渐建立与确立他们的个体模型、社团模型,进行知识组织。比如将用户所属社团模型组内的文件组织起来,作为服务推荐的内容,利用其他相似用户的信息帮助用户获取知识。同时,根据时间建立用户的长期与短期使用模型,使组织方式能够根据用户的需求变化做出相应调整。通过用户使用记录进行知识组织,从用户角度建立知识联系,充分体现用户的需求。
  用户模型中访问的文件通常是用户根据个人经验与知识结构查找、发现的,它们具有一定的内在逻辑联系,是解决某一问题的方案或满足用户具体需求的知识集合,而且可能包含体系中组织方法没有发现的知识联系。有针对性地对不同集合进行分析研究,能够发现不同类型用户的使用方式、关注的文件信息,发掘档案中新的更多的知识。
  同时,通过对查询词进行分词、同义扩展与相关概念关联等语义分析,并对用户查询的文件进行排序计算,确定文件的相关度或重要等级,提高检索的准确率与查全率。各种方法可以单独使用也可以组合成更多的组织逻辑,相互补充、相辅相成,提供多样化的知识组织,从不同的视角提供不同的方法进行知识发现,使档案信息资源成为内容高度集中而又相互关联的知识网络。
  3.知识服务应用层
  知识服务应用层包含通用服务、个性化服务与增值服务。通用服务有Web浏览、检索、资源导航、查询关键词智能提示等基本功能,并在浏览、检索界面中将知识元、文件间的各种链接与关联展现给用户,为用户提供知识线索、知识导引。个性化服务根据使用记录发掘而来的使用模式或用户的定制要求,为用户提供个性化的Web页面、栏目,为其动态调整网站结构、显示的文件信息及知识联系;利用E-mail、SMS等多种传递方式将档案文件自动发送给用户。增值服务,主要包括参考咨询、代检代查、文件解读、专题研究与报道等,提供能够用于决策支持、解决问题的服务。
  同时,把用户浏览、查询式的自助服务提升到基于内容的互动服务,增强与用户的互动,采用实时咨询、BBS,应用Blog、Wiki和SNS等促进知识共享、知识交流,满足用户对个性化以及即时访问数据和信息的实际需要。
  4.其他相关技术
  档案馆之间异地异构访问数据的需求越来越多,知识服务型网站应该具有通用的开放标准接口。Web Service以XML技术为基础,是一个跨平台的、与语言无关的标准。Web Service依照UDDI协定进行目录查找,通过SOAP协议进行访问,而且只要WSDL接口封装良好,外界用户难以访问服务端的数据。依靠Web Service可以实施网站之间的连接和集成,共享不同档案馆的信息资源与应用功能。传统网站架构方法建立在紧耦合基础之上,相对固定,扩展性、灵活性较低。Web Service标准的成熟和普及应用为实现SOA(面向服务架构)提供了有力支持。知识服务型门户网站是面向服务的,可以引入SOA,优化网站基础架构,提高架构的灵活性。比如在知识资源整合层与服务应用层间再抽象出一个层次,细化实现功能与业务逻辑。
  在与Web用户端的交互中,Ajax的数据异步调用(无刷新更新页面)技术,可对网页的加载进行优化,减轻服务器的负担,加快知识组织动态重组、个性化组织的响应速度,增强用户的使用体验。在数据交互中使用JSON替代XML作为传输格式,相对于XML数据,可以减少数据的传输量,并且使Web用户端数据解析的难度降低、性能提高。例如,通过ExtJs、Jquery可以设计出具有更好使用体验的Web服务应用。
  
  注释:
  ①冯湘君.图书馆工作与研究[J],档案馆与图书馆知识服务的比较分析2006(4):19-21.
  ②王兰成.论知识集成环境下的档案信息组织与检索发展[J],档案学研究 2008(5):45-50. (责任编辑:nylw.net)转贴于八度论文发表网: http://www.8dulw.com(论文网__代写代发论文_论文发表_毕业论文_免费论文范文网_论文格式_广东论文网_广州论文网)
发表评论
本站模板均经测试成功,请放心下载,遇到任何问题或者需要购买付费论文请联系本站。
表情:
验证码:点击我更换图片