对社会化媒体资源长期保存的思考(3)

作者:涂海丽 唐晓波 更新时间:2014-12-15 12:44 点击:
【论文发表关健词】关键词:社会化媒体 数字资源 长期保存
【职称论文摘要】
3.4 如何收集、保存、利用 社会化媒体资源的长期保存不可避免地涉及数字资源的长期保存收集、保存和提供利用。在这些环节上,一些项目组或学者做过相关探索:荷兰1995年启动的DNEP项目,开启了深层网络资源缴送与长

      3.4 如何收集、保存、利用
   社会化媒体资源的长期保存不可避免地涉及数字资源的长期保存收集、保存和提供利用。在这些环节上,一些项目组或学者做过相关探索:荷兰1995年启动的DNEP项目,开启了深层网络资源缴送与长期保存的先河[33];美国的Internet Archive项目(网页信息存档)自1996年起就对全球可抓取的网页定期收录和进行长期分类保存,并开发了针对这些保存网页的检索系统,现已与多家机构合作共享,为公众提供网页全文检索服务;法国国家图书馆按网页信息资源收集的难易程度采取的自动收集、手动收集、专题收集,并对收集的数据进行长期保存[34];英国的Archive Press项目在保存博客信息内容上另辟蹊径,开发基于网络种子的保存模式,去除用户不需要的网页框架、色彩等内容,选择并整合博客信息内容进行保存[35]。David Tarrant提出了数据载体关联保存的思想,并进一步指出用RDF和OWL技术构建载体关联可以减少数据冗余,为数据资源的载体保存提供了很好的思路[36]。以上的缴送、分类保存、跨平台信息检索、自动收集、进行选择整合保存、联合保存和基于语义网技术的载体保存都给社会化媒体资源如何保存提供了很好的方法。由于社会化媒体资源分布的广泛性和数量之多,无法用手工方式进行,因此自动采集工具、元数据、大容量存储设备、搜索技术的开发和应用是关键。Angela Dappert指出数字资源的保存依赖元数据,元数据需要描述资源、组织需求、环境、行为等要素[40]。云存储技术可能是未来解决网络数字资源长期保存的可行技术。2009年在华盛顿召开的“数字资源保存存储架构设计”会议上, Fedora Commons、DuraSpace、Meta Archive、LOCK SS、Library of Congress等机构的研究人员都提及云存储研究[38]。总之,社会化媒体资源的保存需要平台运营商的参与,与图书馆等机构合作,分类分流保存,平台运营商通过云平台进行存储,保存用户信息、用户生成信息、用户隐私信息;进行用户关注信息的二次处理;提供图书馆等机构需要的资源和保存技术。其他机构为辅,如国家图书馆、国家博物馆,保存网站框架与技术信息,网上公开信息。保存和利用并重,随时为国家安全机构或国家统计机构提供用户总体信息和必要的个人及个人行为信息。另外,数据自动更新、迁移、仿真、数据再造(数据恢复与数据考古)、数据转换等技术解决了资源受设备生命周期的影响而损毁的问题,也是在社会化媒体资源长期保存的维护过程中可以借鉴的方法。
  3.5 如何解决保存中的法律、资金问题
   商业网站及个人博客等都有自己的访问权限,未经授权私自抓取与保存,将面临侵权控告的风险。由于社会化媒体资源的数量多且分散,不像出版产品的创作者、制作者、保存者的角色那么明确,创作源头难寻,知识产权所有者难以明确,使得征求网络资源的创作者及版权所有者获得公益保存权的难度太大,这就需要建立国内的数字资源主动存缴机制,使社会化媒体资源保存工作顺利开展。互联网本身无国界,一国未经他国允许擅自收集和保存他国网络资源,将会面临同样的问题,而各国法律不一,跨国侵权将会使问题变得更加复杂和严重。需要争取国际立法,在保护知识产权及版权的基础上,给予为谋求长远公共利益而非私自营利为目的数字资源长期保存机构的正当权利。另外,长期保存过程中也会遇到内部安全管理不善和受黑客攻击的威胁,因此保存过程中的安全问题也需要技术防范和法律支持。网络资源的保存成本很高,2004年就有人做过分析,1TB的存储设备需花2万元,可以存发1亿个网页。Internet Archive 项目组估算,光收集1T网络资源需花费3,000美元。Gartner集团经过预算认为购买设备的费用占数字资源保存总投入的三分之一,另有些人认为初期投入占总投入不到10%。初期购买设备的投入只是总投入的一小部分,后续的软硬件更新、系统维护、数据监护的费用将占绝大部分。经费的预算和来源将是社会化媒体资源保存的又一大问题。英国的LIFE项目通过建立数字资源保存生命周期模型,研究数字资源保存的成本[39]。丹麦借助于OAIS的数字资源长期保存过程模型来评价保存成本[40]。社会化媒体资源的保存不仅要考虑保存过程中的成本还应该计算数字资源二次加工及后续的维护成本。经费的来源应该学习国外的做法,像LOCKSS项目和Portico项目经费均来自多个渠道,LOCKSS项目经费来自梅隆基金、国家科学基金及联盟成员经费,Portico项目经费来自梅隆基金、图书馆出版商年费、慈善机构基金会及政府机构资助[41-42]。社会化媒体资源长期保存的经费应该来自互联网企业、图书馆等成员经费,还应该争取政府、慈善机构资助,及收取其他资源使用企业或个人的年费或会员费。
  4 结语
  社会化媒体资源是一种重要的网络数字资源,是Web2.0技术应用的产物,包括社会化媒体工具和网站,以及这些工具和网站上主要由用户分享的信息内容。社会化媒体资源凝结着在线媒体开发者和用户的智慧,反映了这种新媒体时代的历史印迹,是一种重要的数字文化遗产,需要长期保存下来。现有的保存策略是由图书馆将博客、微博等某些社会化媒体资源作为网络资源进行长期保存,这势必会遗漏一些重要的资源。本文认为:(1)应该吸纳有资质的平台运营商参与长期保存工作,与图书馆分工合作,互联网企业提供自动采集技术、云存储、智能搜索等技术,负责用户生成内容的二次加工及保存,图书馆负责网站、工具及重要事件信息、原创网络作品等的保存,双方资源通过公共入口为用户提供服务。(2)保存工作分数字资源采集、保存和使用三个方面的工作。参照已有的资源选择标准,运用自动采集工具加手动采集;运用云存储技术开展保存工作;运用智能搜索技术进行资源的提供。(3)社会化媒体资源无国界,知识产权、出版权、保存权三权分离,要使长期保存这种公益活动正常开展,就应该寻求国际立法,明确规范保存机构的权利、义务及守则。(4)社会化媒体资源保存保存需要巨额资金的支持,一方面要合理评估保存和维护成本,另一方面寻求政府、慈善机构、使用者等多方面的资助。

       参考文献:
  [1]CIC中国社会化媒体格局图2013[EB/OL ].[2013-04-02].http://www.ciccorporate.com/index.phpoption=com_c
  ontent&view=article&id=1079&catid=84:archives-2013 (责任编辑:论文发表网)转贴于八度论文发表网: http://www.8dulw.com(论文网__代写代发论文_论文发表_毕业论文_免费论文范文网_论文格式_广东论文网_广州论文网)

发表评论
本站模板均经测试成功,请放心下载,遇到任何问题或者需要购买付费论文请联系本站。
表情:
验证码:点击我更换图片