首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 265 毫秒
1.
李媛媛  李旭晖 《情报学报》2020,39(4):436-449
以博客、即时通讯、社会网络、社群共享、社会化标注等为代表的Web 2.0应用技术,使用户、信息、资源构成关系紧密的web网络。目前将本体应用到社会化标签用户动态兴趣的研究资料极为稀少,尚无法满足平台对用户兴趣精准把控的需求。本研究从此角度出发,探讨兴趣模型的构建方法。在《中国分类主题词表》和《中国图书馆分类法》对词语的约束规则和关系定义的基础上,构建豆瓣读书用户的兴趣标签本体;并根据再现率、覆盖度、热度率指标对标签的兴趣强度、稳定性进行预测实验,确定兴趣的表示形式,以此构建初始兴趣模型,并提出相应的兴趣节点更新流程。本研究提出的基于本体的用户兴趣模型及更新流程在用户兴趣表示的深度及广度上有了一定程度的提升,在标签资源推荐、检索等实践应用上其适用性更强。  相似文献   

2.
基于社会化标注的个性化推荐研究进展   总被引:6,自引:2,他引:4  
社会化标注是当前互联网研究中的一个热点.本文在对社会化标注的内涵和结构加以简单介绍的基础上,重点探讨了基于社会化标注进行推荐的相关进展.首先是明确了标签对于用户模型的意义,接着,从用户、资源和标签三个角度对基于社会化标注的聚类算法进行了讨论.同时也对基于社会化标注的排序算法进行了分析,并进一步将其分为依附补充、独立排序和通用排序三类算法.然后,对标签推荐方面的研究进行了探讨,主要是围绕内容分析、协同分析、语义分析三个方面展开的.最后,分析了社会化标注中个性化信息推荐的研究,发现借助矩阵、聚类和网络的分析是三种主要思路.  相似文献   

3.
针对Web 2.0环境下大众分类系统中用户、资源和标签之间的三元相关关系,本文提出一种基于三部图的用户兴趣扩散模型,据此为用户进行网络资源的推荐.其主要思想是:通过迭代的扩散机制,使目标用户对信息的兴趣依三部图结构扩散至其他的用户、标签和资源上,然后以资源兴趣度排序为依据,在目标用户未曾收藏的资源中产生推荐.该推荐方法的优势在于扩大了推荐范围,避免了数据稀疏对推荐造成的干扰.利用公共数据集进行的实验表明,本文提出的推荐方法其准确率和召回率优于基于二部图用户兴趣扩散的资源推荐结果.  相似文献   

4.
一种基于用户标签网络的个性化推荐方法   总被引:1,自引:0,他引:1  
基于标签进行个性化推荐是目前的一个研究热点,不同的推荐算法对标签进行了不同的处理.用户使用的标签之间存在着某种内在联系,由此可构建用户标签网络.根据这一启示,本文提出了一种基于用户标签网络的个性化推荐算法.首先,将用户标签网络视为用户兴趣模型雏形,利用社会网络分析方法计算标签权重,并以加权标签集的形式表示用户兴趣模型,最后将标签权重转化为资源与用户兴趣的相似度,进而实现个性化推荐.实验表明,本方法能较为准确地揭示用户的兴趣,产生的推荐资源与用户兴趣匹配程度较高.  相似文献   

5.
基于文档聚类的Web辅助浏览研究   总被引:2,自引:0,他引:2  
王勋  刘君强 《情报学报》2004,23(2):168-172
目前的搜索引擎在方便人们查询的同时也存在不足 ,由于它们并非面向某个特定用户服务 ,所以并不能反映用户的个性化需求 ,查询得到的信息往往还是有大量的冗余。为此本文提出了一种基于文档聚类的网络辅助浏览技术。首先给出了模糊概念图的模型来描述词语间的关系 ,然后将Web文档转化为矢量文档表示 ,利用基于K Means聚类方法对矢量文档进行聚类 ,通过确认最终抽取出用户兴趣模式 ,从而辅助用户实现个性化搜索  相似文献   

6.
[目的/意义]对舞蹈类非物质文化遗产及其社会化标签的存在形式与结构进行调查,提出利用改进的关系强度计算方法来计算社会化标签网络中舞蹈类非物质文化遗产之间隐性的知识关联。[方法/过程]首先梳理舞蹈类非物质文化遗产的存储状态;其次探讨舞蹈资源社会化标签的存在形式,并构建其社会化标签网络模型;然后提出基于SNA的舞蹈类资源改进的关系强度计算方法;最后通过实际数据对所提方法进行实证检验。[结果/结论]实验结果表明,基于SNA的舞蹈类资源关系模型能够有效挖掘不同舞蹈类非物质文化遗产之间的隐性知识关联,并具有实际的可操作性。  相似文献   

7.
Web挖掘技术在电子商务中的应用研究   总被引:16,自引:0,他引:16  
刘培刚 《情报学报》2002,21(6):680-685
本文基于国内外最新研究成果对电子商务中应用的Web挖掘技术进行了研究。对于个性化电子商务网站中难以发现用户行为特征问题 ,给出了基于Web日志的客户群体聚类算法及Web页面聚类算法。利用这些Web挖掘技术可有效挖掘用户个性特征 ,从而指导电子商务网站资源的组织和分配。  相似文献   

8.
吴瑞  史文武 《情报学报》2006,25(5):629-633
基于用户访问网页的不同序列反映了用户特定的兴趣,提出了Web日志中用户存取模式的聚类算法。利用传统的Leader算法只扫描数据集一遍的优点,以及粗糙理论在处理含有不确定信息问题上的优势,给出了结合粗糙理论的改进Leader算法对用户存取模式进行聚类方法,使得同一类中的用户存取模式尽可能的相近或相似,不同类中的模式尽可能的相异。实验结果表明,该算法在可承受的计算时间内可对Web日志中的用户存取模式进行有效聚类。  相似文献   

9.
面向网络问答社区海量问题内容组织的现实需求,针对用户提问的文本特点对其进行多层次主题聚类与图谱构建。通过充分融合Glove和Word2vec算法的优势,对用户提问进行文本特征表示。在此基础上利用不同聚类算法对用户提问进行多层次聚类,并利用TextRank生成聚类标签,然后基于主题间层次结构,利用图模型将不同提问文本的关联关系呈现出来,从而构建网络问答社区用户提问主题聚类图谱,以此提升网络问答社区平台知识资源的组织与利用效率,为知识查询和推荐提供索引。  相似文献   

10.
目前,社会化标注已经成为个性化信息推荐领域中的研究热点之一,标签质量对于推荐效果的影响也受到了广泛关注.本文针对标签的质量问题,指出用户标注偏差普遍存在于标注系统中,尤其是形式偏差,给用户兴趣模型的合理提取形成了阻碍.基于此,我们提出了主流标签的概念,以其体现的大众智慧来克服标注偏差所带来的影响,通过分析资源中标签的平均标注率进行主流标签数量的确定,实现资源模型和用户协同模型的构建,并进一步结合兴趣度对用户协同模型加以了改进.最后,基于Delicious的数据和用户参与评分法,文章运用余弦相似性对模型推荐效果进行了验证.  相似文献   

11.
分众分类法Folksonomy作为一种平民分类法是Web 2.0时代的重要产物,为网络知识的组织和共享提供了一个良好的途径。分众分类系统中,用户通过标签Ta g对网络资源进行标注,标签特征一定程度上反映了用户的行为特征,因此文章首先通过对用户标签的统计分析,总结用户的标签特征,然后分别从标注动机、用户认知和社会认同角度对用户行为进行研究,最后根据用户的网络行为建立用户兴趣模型。  相似文献   

12.
web用户聚类对于个性化服务、网站结构优化等具有重要意义。文章从用户的访问路径、项目评分等角度总结了用户聚类方法及算法,指出当前用户聚类研究存在的不足,提出了结合Web挖掘与社会网络分析方法的用户聚类的模型,分析了两者结合的必要性及结合策略,形成较为完善的用户聚类机制。  相似文献   

13.
一种基于SOM的中文Web文档层次聚类方法   总被引:10,自引:0,他引:10  
陈福集  杨善林 《情报学报》2002,21(2):173-176
近年来Internet迅猛发展 ,网上的信息急剧膨胀 ,如何高效、高质量地检索到用户所感兴趣的中文信息资源 ,是当前我国Internet资源发现的热点问题之一。本文将神经网络聚类方法之一SOM(Self OrganizingMap ,自组织特征映射 )的思想和方法引入中文Web搜索引擎 ,首先探讨了其网络模型和算法 ,而后提出一种聚类用户所感兴趣的中文Web文档的层次聚类方法 ,从而提高中文Web文档的检索质量  相似文献   

14.
基于序列模式的个性化Web页面推荐模型*   总被引:1,自引:1,他引:0  
基于数据挖掘中的序列模式方法,提出一种个性化Web页面推荐模型。该模型首先利用Web使用数据预处理提取Web交易事务集,然后应用序列模式算法挖掘频繁(连续)序列,最后通过构建频繁(连续)序列树生成用户偏好视图以生成个性化Web页面推荐集。  相似文献   

15.
一种基于后缀树的Web搜索结果聚类方法   总被引:3,自引:2,他引:1  
为同时满足Web搜索结果聚类的关联性、快速性以及类别描述的可浏览性等需求,本文提出了一种适合中文Web信息搜索结果的后缀树聚类算法,其中后缀树的构建以中文汉字为基本单位,一种有效的策略解决了基于二进制方法合并短语类后的类别描述问题,利用短语类语义层面的相似性合并同义短语类,有效地改善了聚类结果的质量.测试结果表明:与传统的文档聚类算法相比,基于后缀树的算法在Web文档聚类的精度和效率方面具有较强的优越性.  相似文献   

16.
在分析标签共现的基础上, 提出一种基于共现的标签谱聚类方法, 该方法直接利用标签的共现关系来测度标签的相关性, 能够避免将标签表示成向量空间模型时所带来的高维稀疏等问题.在衡量标签的共现相似性时, 设计一种综合的方法, 并给出标签综合共现相似度的计算公式.与传统的单一利用标签的个体共现来衡量其相似性相比, 综合的方法同时考虑标签的个体共现相似性和标签的群体共现相似性, 能够更加精确地刻画标签的共现相似度.实验结果表明, 基于综合共现相似度的标签共现谱聚类方法具有较好的效果.  相似文献   

17.
树编辑距离在Web信息抽取中的应用与实现*   总被引:1,自引:0,他引:1  
引入编辑距离的概念,探讨如何构造标签树,并利用标签树匹配算法来量化网页结构相似度。该算法被应用于Web信息抽取,通过URL相似度算法进行样本网页的粗聚类,进一步采用树的相似度匹配算法实现细聚类,从而获取模板网页。在模板网页的基础上,再次引入结构相似度算法并结合基于模板网页的抽取规则实现网页的自动化抽取。实验证明,该算法的引入能够有效提高包装器的抽取精度和半自动化能力。  相似文献   

18.
User queries to the Web tend to have more than one interpretation due to their ambiguity and other characteristics. How to diversify the ranking results to meet users’ various potential information needs has attracted considerable attention recently. This paper is aimed at mining the subtopics of a query either indirectly from the returned results of retrieval systems or directly from the query itself to diversify the search results. For the indirect subtopic mining approach, clustering the retrieval results and summarizing the content of clusters is investigated. In addition, labeling topic categories and concept tags on each returned document is explored. For the direct subtopic mining approach, several external resources, such as Wikipedia, Open Directory Project, search query logs, and the related search services of search engines, are consulted. Furthermore, we propose a diversified retrieval model to rank documents with respect to the mined subtopics for balancing relevance and diversity. Experiments are conducted on the ClueWeb09 dataset with the topics of the TREC09 and TREC10 Web Track diversity tasks. Experimental results show that the proposed subtopic-based diversification algorithm significantly outperforms the state-of-the-art models in the TREC09 and TREC10 Web Track diversity tasks. The best performance our proposed algorithm achieves is α-nDCG@5 0.307, IA-P@5 0.121, and α#-nDCG@5 0.214 on the TREC09, as well as α-nDCG@10 0.421, IA-P@10 0.201, and α#-nDCG@10 0.311 on the TREC10. The results conclude that the subtopic mining technique with the up-to-date users’ search query logs is the most effective way to generate the subtopics of a query, and the proposed subtopic-based diversification algorithm can select the documents covering various subtopics.  相似文献   

19.
面向Web3.0的分众分类研究   总被引:4,自引:1,他引:3  
在全面分析Web3.0及分众分类的基本特征的基础上,针对Web3.0的的核心理念和目前分众分类存在的局限性,从微内容的自由整合与过滤、微内容的标准化与结构化、标注的规范控制、标签的基本属性、标签分类与聚类、标签间的关联、标签与本体的结合等方面探讨面向Web3.0的分众分类未来研究方向,最终实现分众分类体系的优化。  相似文献   

20.
一种基于网页分割的Web信息检索方法   总被引:2,自引:0,他引:2  
提出一种基于网页内容分割的Web信息检索算法。该算法根据网页半结构化的特点,按照HTML标记和网页的内容将网页进行区域分割。在建立HTML标记树的基础上,利用了的内容相似性和视觉相似性进行节点的整合。在检索和排序中,根据用户的查询,充分利用了区域信息来对相关的检索结果进行排序。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号