民乐音频数据库的安全建设研究(2)

作者:李经 更新时间:2017-07-18 14:46 点击:
【论文发表关健词】民乐;元数据;安全
【职称论文摘要】
4 民乐音频数据库功能设计 从民乐发展的现状来看,民乐的数字化保护不应局限于静态固化的记录,而更应重视向前的发展和传承。民乐音频数据库在功能设计上不仅要发挥数字保护的作用,还应通过机器学习算法从不同层面


4 民乐音频数据库功能设计
从民乐发展的现状来看,民乐的数字化保护不应局限于静态固化的记录,而更应重视向前的发展和传承。民乐音频数据库在功能设计上不仅要发挥数字保护的作用,还应通过机器学习算法从不同层面、不同角度开展民乐音频价值发掘和民乐知识普及和教育,为用户提供便捷、高效、智能的服务。
4.1 基于无监督学习的自动分类
传统数据资源分类方法如分众分类法[5],多是基于关键词或标签,通过事先设定好类别,利用一种或多种分类模型,将样本划分到指定的类别之中。这类方法适用于分类条件清晰的特征,如前文提到的元数据标准和分类标准。由于民乐的受众较少,普及性较低,使用分众分类法对于没有民乐背景知识的社会大众,民乐音频只能按目查找,很难激发用户兴趣。因此,本研究引入了没有指定的分类标签和类别数目,基于无监督学习的自动分类K-means算法,以保证分类结果的新异性。这种算法的自动分类对象可以是音频,也可以是音频某一元数据。下面,以作者为例,简要概述本数据库的分类算法,如表2所示。
4.2 基于有监督学习的个性化推荐
不同于作者和音频的自动分类需求,民乐音频数据库希望通过UGC对用户可能感兴趣的音频、作者进行个性化推荐。传统的推荐方法主要包括基于内容、统计和规则的推荐、协同过滤推荐和组合推荐等。系统在推广过程中,初始用户和用户行为信息较少,数据稀疏问题较为严重,系统冷启动问题较为突出。因此,本数据库将用户分为初始新用户、未初始新用户和历史用户三种,并根据不同用户的特点设计了相应的推荐方法。
初始新用户指首次登录数据库,并根据引导选择了兴趣门类、流派、作者等信息作为初始特征的用户。对于这类用户,数据库采用了基于内容的推荐方法。基于内容的推荐是指通过与样本自身特征的相似度计算,获得相应的推荐结果。SVM是一种有监督的学习模型,通过一个非线性的映射转换,将样本空间映射到一个高维空间中,从而使在低维空间不可分的样本转化为高维可分的方法。通过核函数的转换,可以将推荐问题转化为一个二分类问题,即用户喜欢这首音频或用户不喜欢这首音频。
未初始新用户指首次登录数据库,但没有选择兴趣喜好,即系统无法获得有效信息的用户。对于这类用户,本数据库采用基于统计的推荐方法。这种方法与用户本身无关,即同一时刻任何未初始新用户得到的推荐结果都是相同的。系统综合考虑音频的热度、新度、作者知名度、音频品质、流派流行度等特征进行推荐。
历史用户指已在系统中留存了UGC信息的用户。对于这类用户,数据库采用协同过滤推荐的方法。这种方法依靠用户或音频之间的关联关系进行推荐,即喜欢同一音频的用户群体兴趣相似或兴趣相似的用户喜欢的音频相似。这种推荐方法虽然可以解决推荐结果新异性的问题,但对用户数量依赖较大,在数据稀疏的情况下,很难得到理想推荐结果。因此,本数据库在推广初期,将历史用户并入初始新用户统一处理,采用基于内容的推荐方法。
为了提升推荐的精准度,系统会根据用户的点击浏览操作,同步更新推荐结果。
4.3 其他功能设计
为了更好地发挥民乐音频数据库在民乐价值挖掘和宣传普及方面的效用,系统还以作者、作品为核心建立了民乐领域知识图谱,以半连通无向图的形式,梳理作者、作品、流派、乐器、地域等实体之间的关系,厘清民乐发展脉络。同时,民乐音频数据库在音频溯源与版权保护方面也做了一定的探索。
5 结束语
本文提出了《民族器乐音频资源元数据标准规范》与《民族器乐音频资源分类与代码标准规范》,为民乐音频数据的分类、整理、扩展提供了理论依据。同时,对中国民族器乐音频数据库技术架构和功能设计,以及分级运营模式,满足不同用户群体对民乐音频的品质需求等进行了探讨。本文的研究,为中国民乐的开发性保护和推广提供了创新性的示范作用。
参考文献
[1] Flynn M, Flynn M. Defense Virtual Library: Technical Metadata for the Long-Term Management of Digital Materials: Preliminary Guidelines[J].2002.
[2] Lessick S. SURA/ViDe Digital Video Workshop: A Summary[J]. Library Hi Tech News, 2013, 21(5):12-13.
[3] 姚星星,屈鷴.国外视音频元数据研究综述[J].数字图书馆论坛, 2007(8):11-18.
[4] Wu Y, Guo K. Storage Area Network[J]. Modern Electronic Technique, 2000.

  [5] 周荣庭,郑彬.分众分类:网络时代的新型信息分类法[J].现代图书情报技术,2006, 1(3):72-75. 

(责任编辑:论文发表网)转贴于八度论文发表网: http://www.8dulw.com(论文网__代写代发论文_论文发表_毕业论文_免费论文范文网_论文格式_广东论文网_广州论文网)
发表评论
本站模板均经测试成功,请放心下载,遇到任何问题或者需要购买付费论文请联系本站。
表情:
验证码:点击我更换图片