首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到16条相似文献,搜索用时 335 毫秒
1.
林鑫  周知 《图书情报工作》2015,59(9):97-103
[目的/意义]借鉴活跃度指数的设计思想,提出一种新的标签相关性判断策略,以改善标签相关性判断的效果和策略的通用性.[方法/过程]结合标签相关性判断的特点对活跃度指数的计算方法进行改造,进而提出一种基于多次活跃度指数迭代的标签相关性判断策略,并以社会化标注社区"豆瓣电影"的67 5351位用户的标签数据为例进行实验,以验证策略的效果.[结果/结论]实验结果显示,该策略的召回率为79.6%,准确率为93.3%,均较为理想,明显优于常用的Top-N策略.同时,该策略的通用性较好,适用于视频、音频、文本等各类型媒体.因此,该策略能够较好地解决标签的相关性判断问题.  相似文献   

2.
[目的/意义]社会化标签是我国图书情报与数字图书馆学科领域的研究热点,在近几年的发展过程中,对于标签的研究范围拓展至信息质量、信息检索、信息推荐等多个图情研究领域,对图情学科标签研究进展的分析或评述将为"社会化标签"未来的发展研究提供依据。[方法/过程]选取2010年至2017年间的图情领域期刊文献,利用CiteSpace可视化剖析社会化标签研究热点、发展进程、研究趋势,并从标签应用、标签信息、标签质量、信息推荐、信息检索5个角度对主题研究进行分析总结。[结果/结论]基于社会化标签研究现状及问题提出相关建议,如拓展标签在本体、信息检索层面的研究范围,以用户为中心适应个性化需求,将研究成果应用于实践等。  相似文献   

3.
一种基于句法分析的情感标签抽取方法   总被引:1,自引:0,他引:1  
指出情感标签由评价对象和情感词组成,包含评论的关键要素,能清楚地表达评价者的观点意见。提出一种针对产品网络评论的情感标签抽取模型,利用依存句法分析设计情感标签抽取算法,通过情感极性计算对抽取出的情感标签进行过滤。通过放宽的抽取规则与情感极性过滤相结合,以提高情感标签的召回率,实现潜在评价对象的抽取。最后用网络抓取的产品评论语料作为测试数据集对模型进行测试,获得较高的抽取准确率和召回率,并对模型中存在的问题进行总结,作为模型改善的指导。  相似文献   

4.
[目的/意义] 对比文件是用以判断专利能否授权或无效的重要文件,针对传统信息检索方法的不足且鲜有利用机器学习方法研究对比文件检索的问题,在引入对比文件信息的基础上,构建专利相关性判定模型。[方法/过程] 以专利无效判决书中的目标专利与对比文件为数据集进行实验,提取文本相似度、共现词汇和共词数量特征信息,利用GBDT模型将对比文件的检索问题转化为判断其是否相关的分类问题。[结果/结论] 研究结果表明,不同字段数据对分类效果的贡献不同,其中说明书字段的准确率、召回率和F1值分别为79%、48%和59%,并且多特征集成后的分类效果显著优于单一文本相似度的结果,最后对实验错分情况进行分析,指出本研究下一步的研究方向。  相似文献   

5.
宋灵超  黄崑 《图书情报工作》2016,60(21):103-112
[目的/意义] 提出利用社会标签自动分类图片情感类型的方法,服务基于情感特征的图像检索与利用。[方法/过程] 以Flickr图片为例,利用PMI算法对WordNet-Affect词表进行预处理形成典型情感词表;结合Ekman提出的6类基本情感类型,利用标签对图片情感类型进行标注;并且,通过实验对分类标注效果进行验证;最后,讨论图片特点、标注意图、非情感标签数量对分类标注效果的影响。[结果/结论] 研究发现,一幅图片的非情感标签与情感标签在表现图片整体情感类型的倾向性上具有较高一致性;结合PMI算法,利用预处理后的典型情感词表标注图片的结果优于未处理的WordNet-Affect词表;并且,分类标注效果与人工标注结果也具有较好的一致性,其中,快乐类(Happy)和忧伤类(Sad)图片的分类标注一致性最高,惊讶类(Surprise)的分类标注一致性最低;分析发现,仅通过标签标注图片情感类型的过程中,分类标注效果与图片情感的典型性、单一性以及图片发布方和欣赏者意图、动机的差异、图片的非情感标签个数都有关系。  相似文献   

6.
[目的/意义]针对目前使用标签推荐方法所得结果不理想的问题,改进传统相似度计算方式,并结合多种标签推荐方法,提高推荐准确性。[方法/过程]融合基于内容与协同过滤的推荐思想,利用LDA进行相似度计算得出资源与用户的近邻集合,并抽取资源内容关键词,以此构建标签混合推荐模型,最后以"豆瓣读书"为例对模型进行验证,同时与几种标签推荐方法进行比较。[结果/结论]在社会标注系统中,必须考虑用户-资源-标签3个维度,仅考虑单一角度势必会造成结果的不完整,同时在相似度计算时引入LDA能够挖掘潜在语义关系,提高推荐质量,且组合多种方法取长补短可以令推荐结果更为满意。  相似文献   

7.
[目的/意义]为旅游景点生成高质量的文化资源标签,解决文化旅游服务中信息检索困难、推荐形式单一的问题。[方法/过程]首先,设计包含显式和隐式两种标签类型的文化资源标签体系;然后,提出基于特征词筛选和噪声词过滤的显式标签生成方法,以及设计隐式标签中文化感知强度和文化感知相似度的计算方法,并基于以上方法生成景点文化资源标签;最后,针对旅游信息服务中的不同场景,提出基于文化资源标签的检索和推荐方法。[结果/结论]以武汉市的真实旅游数据为例进行实证研究,结果表明,基于本文方法生成的标签能够准确刻画景点的文化资源特征,基于标签的检索和推荐方法均具备较强的可解释性,可有效提升信息服务的透明度和用户对结果的信任度,对其他领域的推荐解释性研究具有参考价值。  相似文献   

8.
[目的/意义]将从互联网大数据中无监督学习的结果迁移到目标领城,解决目标领城因学习样本有限而信息识别效果难以提升的问题。[方法/过程]使用以中文维基百科等数据预训练的RoBERTa模型进行迁移学习,将学习结果映射到目标领城后使用DPCNN对其进行聚合凝练,然后结合部分标注数据微调模型完成领域信息的精准识别。[结果/结论]在10个领城内与未进行迁移学习的模型及经典模型TextCNN对比,提出的模型均较大幅度优于对比模型,平均后的精确率绝对提高4.15%、3.43%,召回率绝对提高4.55%、3.44%,F1分数绝对提高4.52%.3.44%,表明利用网络大数据迁移学习可以显著提升目标领城的信息识别效果。  相似文献   

9.
[目的/意义] 利用社会化标签对电影资源进行标注已成为新网络环境下电影资源组织的新方式,构建电影资源本体对规范电影标签语义、提高电影资源检索效率具有重要现实意义。[方法/过程] 针对目前电影资源本体构建方法及构建过程存在的问题,提出利用社会化标签构建电影资源本体的思路,在深入剖析电影标签与电影资源本体映射关系的基础上,揭示一种基于社会化标签的电影资源本体构建方法,并给出利用该法构建电影资源本体的详细流程。[结果/结论] 利用豆瓣电影中的标签数据集构建一个电影资源本体,并分析基于社会化标签电影资源本体构建方法的科学性和优越性。  相似文献   

10.
[目的/意义] 研究网络环境下大学生群体的信息偶遇敏感影响因素,以指导大学生群体提高信息偶遇能力,继而提升大学生信息素养。[方法/过程] 使用信息增益分析各影响因素与信息偶遇发生频次之间的相关性,构建敏感影响因素模型,并进一步利用支持向量机(SVM)建立信息偶遇频次预测模型。[结果/结论] 与发生信息偶遇最相关的10个影响因素分布于信息用户、偶遇信息、网络环境、情境因素4个维度;模型分类预测精度达82.96%,说明SVM对预测信息偶遇频次有良好效果。  相似文献   

11.
认为社会化标签没有特定的组织结构,标签的质量也会有优有劣。此外,同一个社会化标签对不同的人重要程度不尽相同。首先利用信息熵来刻画社会化标签对用户的重要性,然后将基于社会化标签信息熵算法和经典的协同过滤算法的个性化推荐结果进行对比,最后发现基于社会化标签信息熵算法在准确度上提高了10.9%。  相似文献   

12.
胡潜  石宇 《图书情报工作》2016,60(8):106-112
[目的/意义] 更全面地理解用户标签使用行为的影响因素,为标签推荐和应用实践提供指导。[方法/过程] 采用日志分析法,从人均标签个数、标签类型分布两个方面分析图书主题的影响,并以计算机、心理学、经济学、文学作品、绘画5类图书为例,基于社会化标注社区豆瓣网的用户数据进行实证分析。[结果/结论] 图书主题会对用户的标签个数及类型分布具有显著影响:①在标签个数方面,计算机、心理学、经济学、文学作品主题图书的人均标签个数相近,显著高于绘画主题图书;②在标签类型分布上,根据5类图书间的差异可分为3组:计算机、心理学和经济学、文学作品和绘画。这一结论对图书标签推荐及图书分面检索和导航系统的设计具有参考作用。  相似文献   

13.
[目的/意义] 为提高标签质量,优化社会标注系统的信息服务提供依据,从用户在社会标注系统中与其他用户交互的视角,探讨不同交互特征用户的标注行为差异。[方法/过程] 以豆瓣读书作为社会标注系统研究样本,从标签数量、标签结构、标签语义、标注动机和活跃度五个角度研究豆瓣用户标注行为的分布特征;使用用户的关注人数、被关注人数和使用年限表征其在社会标注系统中与其他用户的关联和交互程度,通过差异性分析探讨不同交互特征用户标注行为的差异,并通过多元回归分析研究交互特征对这种差异影响的程度。[结果/结论] 实证研究表明,不同交互特征的用户间的社会标注行为存在显著差异:与其他用户交互比较强的用户标签数据集包含更多的标签,关注其他用户越多的用户和被越多用户关注的用户所使用的标签数量越多;使用豆瓣读书年限越长的用户,其平均标签长度和标签重用率越大,而其与其他用户的关注关系对其标签平均长度和标签重用率的影响不大;用户的特殊语种标签比受用户的使用年限影响很大,但一个用户被多少人关注不会显著的影响其特殊语种标签比;关注其他用户越多的用户在标注系统中越活跃。由此可见,社会标注系统可以采取措施加强系统中用户间的交互,通过用户间的相互作用规范用户的社会标注行为,从而提高标签质量。  相似文献   

14.
[目的/意义]对舞蹈类非物质文化遗产及其社会化标签的存在形式与结构进行调查,提出利用改进的关系强度计算方法来计算社会化标签网络中舞蹈类非物质文化遗产之间隐性的知识关联。[方法/过程]首先梳理舞蹈类非物质文化遗产的存储状态;其次探讨舞蹈资源社会化标签的存在形式,并构建其社会化标签网络模型;然后提出基于SNA的舞蹈类资源改进的关系强度计算方法;最后通过实际数据对所提方法进行实证检验。[结果/结论]实验结果表明,基于SNA的舞蹈类资源关系模型能够有效挖掘不同舞蹈类非物质文化遗产之间的隐性知识关联,并具有实际的可操作性。  相似文献   

15.
[目的/意义] 在社会化标注系统中,标签质量往往关乎用户对网络资源的分类、查询、浏览、获取等使用体验,确定影响标签质量的关键因素有助于进一步优化社会化标注系统的资源组织核心功能。[方法/过程] 以社会化标注系统的标签为研究对象,从标注主体、标注客体、标注环境、标注动机、标注方式、标注产物等维度入手重构标签质量影响因素模型,尝试探究影响社会化标签质量的关键因素,并运用问卷调查方法收集数据,结合有监督学习的随机森林算法,建立标签质量影响因素的决策树模型。[结果/结论] 结果显示,标注主体是影响标签质量的首要关键维度,主体的知识结构和认知水平、标注频度及其感知有用性对标签质量的影响突出;标注方式是影响标签质量的次要关键维度,标签推荐和规范标签提示是影响标签质量的重要因素。  相似文献   

16.
社会性标签应用广泛,但理论比较落后。文章提出几个社会性标签理论,以理论为基础,概括出社会性标签的特性。社会性标签的优势突出,但由于自由性而存在的缺陷也相当明显。应该对社会性标签进行适当的控制,提出四种控制方法。其中,有对标签创建的过程中控制,也就是借助并结合传统分类法对社会性标签适当控制,分别是等级分类法对社会性标签控制和分面分类法对社会性标签控制;也有对标签形成后浏览进行控制,即标签云对标签呈现的控制;还有依靠用户社群力量,由用户共同改善他们创建的标签集合,即用户参与的社群力量控制社会性标签。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号