首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 125 毫秒
1.
基于社会化标注的个性化推荐研究进展   总被引:6,自引:2,他引:4  
社会化标注是当前互联网研究中的一个热点.本文在对社会化标注的内涵和结构加以简单介绍的基础上,重点探讨了基于社会化标注进行推荐的相关进展.首先是明确了标签对于用户模型的意义,接着,从用户、资源和标签三个角度对基于社会化标注的聚类算法进行了讨论.同时也对基于社会化标注的排序算法进行了分析,并进一步将其分为依附补充、独立排序和通用排序三类算法.然后,对标签推荐方面的研究进行了探讨,主要是围绕内容分析、协同分析、语义分析三个方面展开的.最后,分析了社会化标注中个性化信息推荐的研究,发现借助矩阵、聚类和网络的分析是三种主要思路.  相似文献   

2.
在分析社会化标注系统标签检索研究现状基础上,针对传统方法可计算性不高、完备性不够、无法分辨自然语言的语义模糊性等不足,提出基于潜在语义分析的社会化标注系统标签语义检索模型,改进标签-资源矩阵权重计算算法,完善社会化标注系统的语义标注方法。并以delicious系统为例,抓取数据进行验证分析,通过对比,证明提出的模型和改进的算法能显著提高标签检索效率。  相似文献   

3.
社会化标签系统中基于密度聚类的Web 用户兴趣建模方法   总被引:1,自引:0,他引:1  
Web用户兴趣模型在个性化信息服务中有着非常重要的作用。本文利用社会化标签的独特优势,针对传统社会化标签聚类方法的局限性,提出了一种基于密度聚类的Web用户兴趣建模方法。首先建立基于社会化标签的向量空间模型,并将社会化标签表示为Web资源及其权重的形式,以此为基础利用DBSCAN算法对其进行聚类,进而依据所有Web用户的标注行为以每个聚类为中介计算特定Web用户对Web资源的兴趣度来构建Web用户兴趣模型。实验结果表明了该方法的优越性。  相似文献   

4.
以ISI的Web of Science数据库为数据来源,采用词共现方法和基于距离的相似性度量算法对原始矩阵进行处理,通过多维尺度和系统聚类分析对社会化标签研究领域的研究主题和热点进行可视化揭示.分析结果表明,对社会化标签的研究主要集中在大众标签的语义表达、标签概念化(本体)、信息过滤、推荐系统、与传统主题词表的兼容问题、对社交网络平台的研究.  相似文献   

5.
国内外社会化标签挖掘研究综述   总被引:1,自引:0,他引:1  
简述社会化标签的相关背景和内涵;重点梳理国内外社会化标签挖掘的主要成果,一方面归纳社会化标签分析、社会化标签推荐及基于社会化标签的个性化推荐等方法,另一方面概述利用社会化标签增强信息检索功能、发现潜在信息、改进传统分类法和辅助构建本体等方面的应用,并总结当前研究存在的不足;然后,概括社会化标签挖掘在相关领域的应用;最后总结全文,对社会化标签挖掘的未来发展方向进行展望。  相似文献   

6.
袁红  乔国慧 《图书情报工作》2014,58(20):112-119
开展基于社会化标签系统、搜索引擎和分类目录3种平台的信息搜寻实验,从相对查全率、相对查准率两个指标的角度比较分析社会化标签系统与其他网络信息搜寻系统的搜寻效率。研究发现,搜索引擎的相对查全率和相对查准率最高,社会化标签系统的搜寻效率也有一定的优势。分类目录比社会化标签的相对查准率低,两者的相对查全率接近。对于某些特定的信息需求,社会化标签系统的搜寻效率甚至超过了搜索引擎。  相似文献   

7.
社会化标注系统中标签检索质量模拟研究   总被引:1,自引:0,他引:1  
社会化标注系统近年发展迅速,伴随出现的垃圾标注泛滥现象不容忽视。本文以社会化标注系统中标签检索质量为研究对象,细化普通用户标注行为,建立社会化标注模拟系统,明确定义系统内用户结构、标注规则、检索策略和检索质量算法,从实证角度评估用户规模变化、用户结构变化、用户标注量变化和垃圾用户的攻击策略选择对标签检索质量的影响。本文对于改善社会化标注系统中的标签检索算法以及提高用户体验具有重要意义。  相似文献   

8.
[目的/意义] 在社会化标注系统中,标签质量往往关乎用户对网络资源的分类、查询、浏览、获取等使用体验,确定影响标签质量的关键因素有助于进一步优化社会化标注系统的资源组织核心功能。[方法/过程] 以社会化标注系统的标签为研究对象,从标注主体、标注客体、标注环境、标注动机、标注方式、标注产物等维度入手重构标签质量影响因素模型,尝试探究影响社会化标签质量的关键因素,并运用问卷调查方法收集数据,结合有监督学习的随机森林算法,建立标签质量影响因素的决策树模型。[结果/结论] 结果显示,标注主体是影响标签质量的首要关键维度,主体的知识结构和认知水平、标注频度及其感知有用性对标签质量的影响突出;标注方式是影响标签质量的次要关键维度,标签推荐和规范标签提示是影响标签质量的重要因素。  相似文献   

9.
在对现有的社会化标签序化方法特点与局限性进行分析的基础上,借鉴社会网络分析(SNA)思想,提出四种基于SNA的社会化标签网络分析方法:点、线、密度分析,中心性分析,凝聚子群分析,以及结构等价分析.同时,利用SNA软件实现基于社会化标签网络的个性化信息服务模型的具体应用,进而为个性化信息服务实践的推进提供一种新的思路.未来需要通过进一步实证分析来检验、完善社会化标签网络的理论研究与实践应用.  相似文献   

10.
[目的/意义] 利用社会化标签对电影资源进行标注已成为新网络环境下电影资源组织的新方式,构建电影资源本体对规范电影标签语义、提高电影资源检索效率具有重要现实意义。[方法/过程] 针对目前电影资源本体构建方法及构建过程存在的问题,提出利用社会化标签构建电影资源本体的思路,在深入剖析电影标签与电影资源本体映射关系的基础上,揭示一种基于社会化标签的电影资源本体构建方法,并给出利用该法构建电影资源本体的详细流程。[结果/结论] 利用豆瓣电影中的标签数据集构建一个电影资源本体,并分析基于社会化标签电影资源本体构建方法的科学性和优越性。  相似文献   

11.
[目的/意义] 为提高标签质量,优化社会标注系统的信息服务提供依据,从用户在社会标注系统中与其他用户交互的视角,探讨不同交互特征用户的标注行为差异。[方法/过程] 以豆瓣读书作为社会标注系统研究样本,从标签数量、标签结构、标签语义、标注动机和活跃度五个角度研究豆瓣用户标注行为的分布特征;使用用户的关注人数、被关注人数和使用年限表征其在社会标注系统中与其他用户的关联和交互程度,通过差异性分析探讨不同交互特征用户标注行为的差异,并通过多元回归分析研究交互特征对这种差异影响的程度。[结果/结论] 实证研究表明,不同交互特征的用户间的社会标注行为存在显著差异:与其他用户交互比较强的用户标签数据集包含更多的标签,关注其他用户越多的用户和被越多用户关注的用户所使用的标签数量越多;使用豆瓣读书年限越长的用户,其平均标签长度和标签重用率越大,而其与其他用户的关注关系对其标签平均长度和标签重用率的影响不大;用户的特殊语种标签比受用户的使用年限影响很大,但一个用户被多少人关注不会显著的影响其特殊语种标签比;关注其他用户越多的用户在标注系统中越活跃。由此可见,社会标注系统可以采取措施加强系统中用户间的交互,通过用户间的相互作用规范用户的社会标注行为,从而提高标签质量。  相似文献   

12.
林鑫  石宇  周知 《图书情报工作》2016,60(17):130-135
[目的/意义] 针对笔者此前提出的标签相关性判断策略进行优化,以提升策略的召回率,从而更好地支持标签应用研究与实践。[方法/过程] 为提升策略的召回率,以标签与认知的基本关系为基础,提出一种基于相对频次的改进策略,并以社会化标注社区"豆瓣电影"的675 351位用户的标签数据为例进行实验,以验证策略的效果。[结果/结论] 结果显示,该策略使得标签相关性判断的效果得到了显著改善。其中,对于频次不小于5的标签,策略的召回率大幅提升,由79.63%升至89.36%;准确率虽有略微下滑,由93.33%降至92.02%,但仍保持在较高水平。  相似文献   

13.
[目的/意义]社会化标签是我国图书情报与数字图书馆学科领域的研究热点,在近几年的发展过程中,对于标签的研究范围拓展至信息质量、信息检索、信息推荐等多个图情研究领域,对图情学科标签研究进展的分析或评述将为"社会化标签"未来的发展研究提供依据。[方法/过程]选取2010年至2017年间的图情领域期刊文献,利用CiteSpace可视化剖析社会化标签研究热点、发展进程、研究趋势,并从标签应用、标签信息、标签质量、信息推荐、信息检索5个角度对主题研究进行分析总结。[结果/结论]基于社会化标签研究现状及问题提出相关建议,如拓展标签在本体、信息检索层面的研究范围,以用户为中心适应个性化需求,将研究成果应用于实践等。  相似文献   

14.
Web 2.0应用的兴起,推进了情报学科由"文献组织"向"知识组织"演化.网页标签作为重要的Web 2 0应用之一,已经成为大众组织知识的常用途径.然而,现有的标签排序方法难以有效满足知识组织的需求.本文在三核协同标签模型的基础上,充分考虑标签和用户、标签和标签、标签和文档之间的关系,提出了一种结合HITS和随机跳转的标签排序方法.该方法利用高质量标签和高质量用户之间的相互加强关系,根据标签之间的相似性来找出高质量相关标签,有效提高标签排序的质量.在Delicious数据集上的实验结果表明,该方法能较大提高标签排序的准确度.  相似文献   

15.
微博是Web2.0时代重要的网络服务工具,作为以用户为中心的信息发布、传播和分享平台,它包含了非常丰富的用户信息。在微博中,可以使用标签表示用户的兴趣和属性。而一个用户的兴趣和属性,通常包含在这个用户的文本信息和网络信息中。针对微博用户的标签进行分析,提出网络正则化的标签分发模型(NTDM)来为用户推荐标签。NTDM模型对用户个人简介中的词语和标签之间的关系进行建模,同时利用其社交网络结构作为模型的正则化因子。在真实数据集上的实验表明,NTDM在效果以及效率上都优于其他方法。  相似文献   

16.
标签形式的社会性语义越来越占据主导地位,使元数据界在这种新形式的信息内容表达和检索方面面临机遇和挑战。其中,主要的挑战是与标签相关的语境信息的缺失。以Flickr标签为例,对如何利用社会性语义资源来丰富主题元数据进行了实验。实验过程包含4个步骤:收集Flickr标签样本;通过共有信息计算标签间的同现情况;通过Google检索结果来追踪标签对的语境信息;用自然语言处理和机器学习技术来抽取标签间的语义关系。本实验能够利用Google搜索结果构建语境库,并且以自然语言处理和机器学习算法对这些语句进行处理。这种新方法对于赋予标签对以一定语义关系有相当高的准确率。也探讨该方法在利用社会性语义丰富的主题元数据方面的意义。  相似文献   

17.
林鑫  周知 《图书情报工作》2015,59(9):97-103
[目的/意义]借鉴活跃度指数的设计思想,提出一种新的标签相关性判断策略,以改善标签相关性判断的效果和策略的通用性.[方法/过程]结合标签相关性判断的特点对活跃度指数的计算方法进行改造,进而提出一种基于多次活跃度指数迭代的标签相关性判断策略,并以社会化标注社区"豆瓣电影"的67 5351位用户的标签数据为例进行实验,以验证策略的效果.[结果/结论]实验结果显示,该策略的召回率为79.6%,准确率为93.3%,均较为理想,明显优于常用的Top-N策略.同时,该策略的通用性较好,适用于视频、音频、文本等各类型媒体.因此,该策略能够较好地解决标签的相关性判断问题.  相似文献   

18.
一种基于网页分割的Web信息检索方法   总被引:2,自引:0,他引:2  
提出一种基于网页内容分割的Web信息检索算法。该算法根据网页半结构化的特点,按照HTML标记和网页的内容将网页进行区域分割。在建立HTML标记树的基础上,利用了的内容相似性和视觉相似性进行节点的整合。在检索和排序中,根据用户的查询,充分利用了区域信息来对相关的检索结果进行排序。  相似文献   

19.
社会性标签应用广泛,但理论比较落后。文章提出几个社会性标签理论,以理论为基础,概括出社会性标签的特性。社会性标签的优势突出,但由于自由性而存在的缺陷也相当明显。应该对社会性标签进行适当的控制,提出四种控制方法。其中,有对标签创建的过程中控制,也就是借助并结合传统分类法对社会性标签适当控制,分别是等级分类法对社会性标签控制和分面分类法对社会性标签控制;也有对标签形成后浏览进行控制,即标签云对标签呈现的控制;还有依靠用户社群力量,由用户共同改善他们创建的标签集合,即用户参与的社群力量控制社会性标签。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号