首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 171 毫秒
1.
林鑫  石宇  周知 《图书情报工作》2016,60(17):130-135
[目的/意义] 针对笔者此前提出的标签相关性判断策略进行优化,以提升策略的召回率,从而更好地支持标签应用研究与实践。[方法/过程] 为提升策略的召回率,以标签与认知的基本关系为基础,提出一种基于相对频次的改进策略,并以社会化标注社区"豆瓣电影"的675 351位用户的标签数据为例进行实验,以验证策略的效果。[结果/结论] 结果显示,该策略使得标签相关性判断的效果得到了显著改善。其中,对于频次不小于5的标签,策略的召回率大幅提升,由79.63%升至89.36%;准确率虽有略微下滑,由93.33%降至92.02%,但仍保持在较高水平。  相似文献   

2.
在分析标签共现的基础上, 提出一种基于共现的标签谱聚类方法, 该方法直接利用标签的共现关系来测度标签的相关性, 能够避免将标签表示成向量空间模型时所带来的高维稀疏等问题.在衡量标签的共现相似性时, 设计一种综合的方法, 并给出标签综合共现相似度的计算公式.与传统的单一利用标签的个体共现来衡量其相似性相比, 综合的方法同时考虑标签的个体共现相似性和标签的群体共现相似性, 能够更加精确地刻画标签的共现相似度.实验结果表明, 基于综合共现相似度的标签共现谱聚类方法具有较好的效果.  相似文献   

3.
大众分类是Web2.0环境下产生的一种新型信息分类法,标签是其中的核心要素,但标签的多样性、模糊性、结构扁平化等缺陷严重影响了信息检索的效率.本文以"豆瓣读书"为例,通过分析标签的统计学规律,挖掘标签间的相互关系,并利用聚类算法对标签进行聚类,构建标签概念空间,从而实现对标签的重新组 织,为用户提供更好地标签导航和浏览机制.实验证明,本文提出的算法模型能够较好地构建标签概念空间.  相似文献   

4.
宋灵超  黄崑 《图书情报工作》2016,60(21):103-112
[目的/意义] 提出利用社会标签自动分类图片情感类型的方法,服务基于情感特征的图像检索与利用。[方法/过程] 以Flickr图片为例,利用PMI算法对WordNet-Affect词表进行预处理形成典型情感词表;结合Ekman提出的6类基本情感类型,利用标签对图片情感类型进行标注;并且,通过实验对分类标注效果进行验证;最后,讨论图片特点、标注意图、非情感标签数量对分类标注效果的影响。[结果/结论] 研究发现,一幅图片的非情感标签与情感标签在表现图片整体情感类型的倾向性上具有较高一致性;结合PMI算法,利用预处理后的典型情感词表标注图片的结果优于未处理的WordNet-Affect词表;并且,分类标注效果与人工标注结果也具有较好的一致性,其中,快乐类(Happy)和忧伤类(Sad)图片的分类标注一致性最高,惊讶类(Surprise)的分类标注一致性最低;分析发现,仅通过标签标注图片情感类型的过程中,分类标注效果与图片情感的典型性、单一性以及图片发布方和欣赏者意图、动机的差异、图片的非情感标签个数都有关系。  相似文献   

5.
Web 2.0应用的兴起,推进了情报学科由"文献组织"向"知识组织"演化.网页标签作为重要的Web 2 0应用之一,已经成为大众组织知识的常用途径.然而,现有的标签排序方法难以有效满足知识组织的需求.本文在三核协同标签模型的基础上,充分考虑标签和用户、标签和标签、标签和文档之间的关系,提出了一种结合HITS和随机跳转的标签排序方法.该方法利用高质量标签和高质量用户之间的相互加强关系,根据标签之间的相似性来找出高质量相关标签,有效提高标签排序的质量.在Delicious数据集上的实验结果表明,该方法能较大提高标签排序的准确度.  相似文献   

6.
提出一种基于N元语法的英文学术文献聚类标签抽取算法,该算法利用N元语法在大规模语料库上进行先期学习生成领域短语词表,再通过K-means算法进行聚类,从聚簇中抽取N元语法项计算TFIDF值,对出现在词表中的特征项赋以更高的权值,以得分最高的特征项作为聚类标签。实验结果表明,该算法能获得更好的实验效果。同时,在抽取聚类标签时提出一种改进的TFIDF权重计算,在评价标签质量时提出一种新的标签评价方法R@N方法。  相似文献   

7.
[目的/意义] 利用社会化标签对电影资源进行标注已成为新网络环境下电影资源组织的新方式,构建电影资源本体对规范电影标签语义、提高电影资源检索效率具有重要现实意义。[方法/过程] 针对目前电影资源本体构建方法及构建过程存在的问题,提出利用社会化标签构建电影资源本体的思路,在深入剖析电影标签与电影资源本体映射关系的基础上,揭示一种基于社会化标签的电影资源本体构建方法,并给出利用该法构建电影资源本体的详细流程。[结果/结论] 利用豆瓣电影中的标签数据集构建一个电影资源本体,并分析基于社会化标签电影资源本体构建方法的科学性和优越性。  相似文献   

8.
[目的/意义]社会化标签是我国图书情报与数字图书馆学科领域的研究热点,在近几年的发展过程中,对于标签的研究范围拓展至信息质量、信息检索、信息推荐等多个图情研究领域,对图情学科标签研究进展的分析或评述将为"社会化标签"未来的发展研究提供依据。[方法/过程]选取2010年至2017年间的图情领域期刊文献,利用CiteSpace可视化剖析社会化标签研究热点、发展进程、研究趋势,并从标签应用、标签信息、标签质量、信息推荐、信息检索5个角度对主题研究进行分析总结。[结果/结论]基于社会化标签研究现状及问题提出相关建议,如拓展标签在本体、信息检索层面的研究范围,以用户为中心适应个性化需求,将研究成果应用于实践等。  相似文献   

9.
[目的/意义]针对目前使用标签推荐方法所得结果不理想的问题,改进传统相似度计算方式,并结合多种标签推荐方法,提高推荐准确性。[方法/过程]融合基于内容与协同过滤的推荐思想,利用LDA进行相似度计算得出资源与用户的近邻集合,并抽取资源内容关键词,以此构建标签混合推荐模型,最后以"豆瓣读书"为例对模型进行验证,同时与几种标签推荐方法进行比较。[结果/结论]在社会标注系统中,必须考虑用户-资源-标签3个维度,仅考虑单一角度势必会造成结果的不完整,同时在相似度计算时引入LDA能够挖掘潜在语义关系,提高推荐质量,且组合多种方法取长补短可以令推荐结果更为满意。  相似文献   

10.
[目的/意义]为旅游景点生成高质量的文化资源标签,解决文化旅游服务中信息检索困难、推荐形式单一的问题。[方法/过程]首先,设计包含显式和隐式两种标签类型的文化资源标签体系;然后,提出基于特征词筛选和噪声词过滤的显式标签生成方法,以及设计隐式标签中文化感知强度和文化感知相似度的计算方法,并基于以上方法生成景点文化资源标签;最后,针对旅游信息服务中的不同场景,提出基于文化资源标签的检索和推荐方法。[结果/结论]以武汉市的真实旅游数据为例进行实证研究,结果表明,基于本文方法生成的标签能够准确刻画景点的文化资源特征,基于标签的检索和推荐方法均具备较强的可解释性,可有效提升信息服务的透明度和用户对结果的信任度,对其他领域的推荐解释性研究具有参考价值。  相似文献   

11.
胡潜  石宇 《图书情报工作》2016,60(8):106-112
[目的/意义] 更全面地理解用户标签使用行为的影响因素,为标签推荐和应用实践提供指导。[方法/过程] 采用日志分析法,从人均标签个数、标签类型分布两个方面分析图书主题的影响,并以计算机、心理学、经济学、文学作品、绘画5类图书为例,基于社会化标注社区豆瓣网的用户数据进行实证分析。[结果/结论] 图书主题会对用户的标签个数及类型分布具有显著影响:①在标签个数方面,计算机、心理学、经济学、文学作品主题图书的人均标签个数相近,显著高于绘画主题图书;②在标签类型分布上,根据5类图书间的差异可分为3组:计算机、心理学和经济学、文学作品和绘画。这一结论对图书标签推荐及图书分面检索和导航系统的设计具有参考作用。  相似文献   

12.
[目的/意义]对舞蹈类非物质文化遗产及其社会化标签的存在形式与结构进行调查,提出利用改进的关系强度计算方法来计算社会化标签网络中舞蹈类非物质文化遗产之间隐性的知识关联。[方法/过程]首先梳理舞蹈类非物质文化遗产的存储状态;其次探讨舞蹈资源社会化标签的存在形式,并构建其社会化标签网络模型;然后提出基于SNA的舞蹈类资源改进的关系强度计算方法;最后通过实际数据对所提方法进行实证检验。[结果/结论]实验结果表明,基于SNA的舞蹈类资源关系模型能够有效挖掘不同舞蹈类非物质文化遗产之间的隐性知识关联,并具有实际的可操作性。  相似文献   

13.
[目的/意义] 为提高标签质量,优化社会标注系统的信息服务提供依据,从用户在社会标注系统中与其他用户交互的视角,探讨不同交互特征用户的标注行为差异。[方法/过程] 以豆瓣读书作为社会标注系统研究样本,从标签数量、标签结构、标签语义、标注动机和活跃度五个角度研究豆瓣用户标注行为的分布特征;使用用户的关注人数、被关注人数和使用年限表征其在社会标注系统中与其他用户的关联和交互程度,通过差异性分析探讨不同交互特征用户标注行为的差异,并通过多元回归分析研究交互特征对这种差异影响的程度。[结果/结论] 实证研究表明,不同交互特征的用户间的社会标注行为存在显著差异:与其他用户交互比较强的用户标签数据集包含更多的标签,关注其他用户越多的用户和被越多用户关注的用户所使用的标签数量越多;使用豆瓣读书年限越长的用户,其平均标签长度和标签重用率越大,而其与其他用户的关注关系对其标签平均长度和标签重用率的影响不大;用户的特殊语种标签比受用户的使用年限影响很大,但一个用户被多少人关注不会显著的影响其特殊语种标签比;关注其他用户越多的用户在标注系统中越活跃。由此可见,社会标注系统可以采取措施加强系统中用户间的交互,通过用户间的相互作用规范用户的社会标注行为,从而提高标签质量。  相似文献   

14.
[目的/意义] 在社会化标注系统中,标签质量往往关乎用户对网络资源的分类、查询、浏览、获取等使用体验,确定影响标签质量的关键因素有助于进一步优化社会化标注系统的资源组织核心功能。[方法/过程] 以社会化标注系统的标签为研究对象,从标注主体、标注客体、标注环境、标注动机、标注方式、标注产物等维度入手重构标签质量影响因素模型,尝试探究影响社会化标签质量的关键因素,并运用问卷调查方法收集数据,结合有监督学习的随机森林算法,建立标签质量影响因素的决策树模型。[结果/结论] 结果显示,标注主体是影响标签质量的首要关键维度,主体的知识结构和认知水平、标注频度及其感知有用性对标签质量的影响突出;标注方式是影响标签质量的次要关键维度,标签推荐和规范标签提示是影响标签质量的重要因素。  相似文献   

15.
认为社会化标签没有特定的组织结构,标签的质量也会有优有劣。此外,同一个社会化标签对不同的人重要程度不尽相同。首先利用信息熵来刻画社会化标签对用户的重要性,然后将基于社会化标签信息熵算法和经典的协同过滤算法的个性化推荐结果进行对比,最后发现基于社会化标签信息熵算法在准确度上提高了10.9%。  相似文献   

16.
[目的/意义]学术成果评价是推进哲学社会科学健康发展的重要因素,长期以来,传统同行评议和科学计量学方法在哲学社会科学学术成果评价中暴露出的问题越来越多,挑战固有方法的统治地位、开发有针对性的评价策略已刻不容缓。文章试图探索大数据环境下哲社学术成果评价的变革及其实现,特别是提出了大数据思维下的哲社学术成果的评价指标体系。[方法/过程]基于比较分析和综合分析,对传统哲学社会科学评价方法的弊端进行分析,然后对大数据给哲学社会科学评价带来的改变进行分析,最后提出基于大数据环境的哲学社会科学评价策略和指标体系。[结果/结论]提出大数据时代哲学社会科学学术成果评价的策略:由引文著录分析转向多维度的引用内容与行为分析,由面向成果的阶段性静态评价转向以"学术活动"为中心的全过程动态评价,由学术影响力评价转向学术价值和社会效益评价。在此基础上,构建由两个一级指标、5个二级指标和34个三级指标组成的大数据背景下哲学社会科学学术成果评价指标体系。  相似文献   

17.
[目的/意义]非遗图片资源社会化标签是大众对图片内容的意识反映,蕴含丰富的知识价值。研究标签之间的关联关系有助于构建针对标签的非遗图片资源主题导航,并对非遗图片资源的组织和展示提供参考。[方法/过程]从标签关联视角探讨非遗图片资源网站社会化标签之间的关联关系,构建关联标签网络和共标签网络,对其进行社会网络分析和对比,并采用可视化方法对主题特征进行展示。[结果/结论]所分析的非遗图片资源社会化标签存在一定主题特征,便于从用户角度组织和利用非遗图片资源,促进非遗文化的传承。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号