首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 109 毫秒
1.
针对传统协同过滤算法依赖单一用户需求形态影响推荐效果的问题,提出一种基于用户多态聚类的数字图书馆个性化推荐方法。该方法以改进的海明距离计算候选邻居集,结合多态相似度进行二次聚类,预测用户的多态需求度并形成推荐。实验表明,使用多态聚类产生的推荐精确度上优于单一聚类产生的推荐。  相似文献   

2.
吴瑞  史文武 《情报学报》2006,25(5):629-633
基于用户访问网页的不同序列反映了用户特定的兴趣,提出了Web日志中用户存取模式的聚类算法。利用传统的Leader算法只扫描数据集一遍的优点,以及粗糙理论在处理含有不确定信息问题上的优势,给出了结合粗糙理论的改进Leader算法对用户存取模式进行聚类方法,使得同一类中的用户存取模式尽可能的相近或相似,不同类中的模式尽可能的相异。实验结果表明,该算法在可承受的计算时间内可对Web日志中的用户存取模式进行有效聚类。  相似文献   

3.
聚类搜索引擎探究   总被引:1,自引:0,他引:1  
一批代表性的聚类搜索引擎的出现,使得聚类搜索引擎的优劣逐步为公众所知.采用聚类算法、重视结果的显示方式、关注用户提问信息、提供个性化服务均是聚类搜索引擎最显著的优点,应该引起足够的重视.针对过分依托原生搜索引擎、没有形成专用聚类算法、搜索速度相对较慢、聚类层次有限等现状,作者最后还对聚类搜索引擎的发展提出了一些建议,比如实现人工聚类与自动聚类结合、增加学术趋势分析功能、加强相关度研究等.  相似文献   

4.
聚类检索述评   总被引:3,自引:0,他引:3  
介绍聚类和聚类检索的概念以及聚类检索在数据库与Web上的应用现状,对聚类检索目前存在的问题,如聚类效果不突出、用户无法 参与聚类过程等进行分析,认为将聚类检索作为数据库或搜索引擎的一种检索功能,是对信息的一种增值性开发利用,会更加完善检索系统;提 出聚类检索应基于个性化用户模式来发展,要将聚类结果可视化,设置允许用户参与操作的检索界面等建议,以期将聚类功能向个性化、智能 化方向推进,更好地满足用户检索需求  相似文献   

5.
用户兴趣模型是个性化服务的核心,对用户兴趣的挖掘可以发现潜在的兴趣知识,提供更为优化的服务.本文将主题图技术与用户兴趣模型结合起来,研究了用户兴趣知识的主题图表示,并在此基础上运用无尺度图K-中心点聚类算法对构建的主题图进行深层次的聚类挖掘,建立了基于主题图的用户兴趣挖掘模型.在解释模型各个模块功能的同时,提出了该过程模型中的关键问题,并对建立模型过程中的无尺度图K-中心点聚类算法、文档中的主题图表示及主题概化和主题图合并等关键问题进行了深入的分析,最终构建了智能主题图,实现了过程建模和事物建模.  相似文献   

6.
随着Internet和电子商务的迅猛发展,聚类技术在Web用户划分方面的作用越来越明显.Web用户聚类的难度在于有成千上万的用户需要聚类,而且每个用户的偏好向量是高维稀疏的.对于处理大规模的数据集,近邻传播算法是一种快速、有效的聚类方法.但面对高维稀疏的数据,近邻传播算法往往不能得到很好的聚类结果,而且该方法不能产生指定类数的聚类.本文提出一种改进的近邻传播算法,使用该方法对Web用户进行聚类.根据灰关系等级和Jaccard系数定义用户相似度矩阵,对算法产生的初始聚类进行重新分配,获得指定类数的聚类.实验结果表明新算法是有效的,与原始近邻传播算法相比,新算法在个性化推荐的应用中具有更好的性能.  相似文献   

7.
社会化标签系统中基于密度聚类的Web 用户兴趣建模方法   总被引:1,自引:0,他引:1  
Web用户兴趣模型在个性化信息服务中有着非常重要的作用。本文利用社会化标签的独特优势,针对传统社会化标签聚类方法的局限性,提出了一种基于密度聚类的Web用户兴趣建模方法。首先建立基于社会化标签的向量空间模型,并将社会化标签表示为Web资源及其权重的形式,以此为基础利用DBSCAN算法对其进行聚类,进而依据所有Web用户的标注行为以每个聚类为中介计算特定Web用户对Web资源的兴趣度来构建Web用户兴趣模型。实验结果表明了该方法的优越性。  相似文献   

8.
情境化推荐中基于超图模式的用户偏好漂移识别研究   总被引:2,自引:0,他引:2  
识别用户偏好漂移是维护用户偏好模式、确保偏好描述准确的关键之一,随着移动商务的迅猛发展,近年来越来越受到重视.一个研究方向是基于聚类实现偏好漂移的识别,但目前研究对于资源对象间多元的弱关联处理存在不足,为此本文结合情境化推荐的特征,构建了情境化资源的超图模型,在对资源相似度、资源簇相似度、用户偏好漂移度等相关概念定义的基础上,提出了一种识别用户偏好漂移的方法.该方法在两阶段层次聚类架构中引入多级超图分割算法,通过两组实验验证了方法的有效性.本文对方法复杂性和应用机制也进行了探讨.  相似文献   

9.
利用系统聚类方法对专题文献的检索结果按用户相关程度进行聚类,并通过实例分析验证了该方法的可行性和有效性。检索结果通过聚类方法处理后,用户可以用最快的速度了解其等级分布,从而对不同等级的检索结果采用不同的阅读方式:是需要通读精读、还是仅阅读摘要甚至忽略不读,从而提高用户的检索效率。  相似文献   

10.
基于蚁群算法与K-means算法相结合的Web用户聚类   总被引:1,自引:1,他引:0  
Web用户聚类是指用聚类算法产生用户会话的聚类,是电子商务中的一个重要问题.该问题的难度在于有成千上万的会话需要聚类,而且每个会话都可描述为一个高维向量.此外,该问题就聚类的数目而言具有指数的复杂性,是一个NP-难的问题.本文提出一种新的聚类方法,该方法将蚁群算法与K-means算法相结合对用户会话进行优化聚类.实验结果表明,与K-means算法相比,该方法在Web导航推荐的应用中具有更好的性能.  相似文献   

11.
一个新的基于协作过滤的用户浏览预测模型   总被引:2,自引:0,他引:2  
本文提出了一个新的基于协作过滤的用户浏览协作预测模型———UNCPM ,它有效地解决了目前协作过滤预测方法的准确性和覆盖率低等问题。UNCPM从Web日志中获取用户浏览信息 ,系统分为两个部分 :离线构件和在线构件。离线构件用于用户浏览历史记录的K means聚类 ,并在聚类时充分考虑URL的相似分析来避免协作过滤的同义性和分散性等不足 ;在线构件用于活动用户预测。该模型可以应用在大型电子商务网站的用户浏览预测上。  相似文献   

12.
采用数据挖掘技术中的关联分析和聚类方法,重点研究Web日志兴趣发现的理论和方法,指出普通日志记录方法的局限性,提出过滤用户偏好的定制Web日志方法,实验结果验证通过该方法采集的数据,可以发现隐藏在日志数据中的关联规则,同时找到相似用户的兴趣和偏好,并且能够提高过滤用户兴趣偏好的精度。  相似文献   

13.
Web内容挖掘在数字图书馆中的应用   总被引:3,自引:1,他引:3  
黎琳  赵英 《图书馆学研究》2006,(2):19-21,24
Web信息是数字图书馆数字资源的重要来源,文章详细阐述了对Web内容中的文本信息的挖掘,包括:文本自动摘要、文本分类和文本聚类。在挖掘过程中基于用户需求和用户特征,针对文本分类,重点分析了分类过程和在数字图书馆中的应用;针对文本聚类,介绍两种基本聚类原理以及与文本分类的不同之处,重点论述其在数字图书馆中如何应用。最后提出内容挖掘与用户挖掘的结合更有助于服务用户。  相似文献   

14.
通过挖掘网络日志中的查询词语义关系,将《知网》的语义知识加入到聚类算法中实现搜索引擎优化。该方法通过机器学习算法深入挖掘查询日志,对其中的查询串进行概念相似度、语义聚类等计算,使返回网页更加合理,将更准确的网页结果呈现在用户面前,能够更好地满足用户需求。  相似文献   

15.
Usability testing is an important element when designing useful, usable academic library Web sites. Since 2001, members of the Florida International University Libraries Web team have worked toward establishing a process that identifies user needs through usability testing. Starting with the libraries’ first Web site redesign project in 2001, the team has taken an active part in improving Web site user experience. After engaging in multiple redesign efforts, the Web team has developed a process that supports awareness of user experience through continual usability testing and feedback gathering. This article presents strategies and practices to measure Web site user experience, including classic usability testing methods (e.g., card sorting activities, focus groups, and task-based user testing), as well as the team's latest effort to assess Web site analytics and content to identify Web site usage patterns and areas of concern. A history of the Florida International University Libraries’ Web site redesign process is presented to illustrate lessons learned and best practices to facilitate future redesign and testing efforts. Taking a longitudinal look at usability testing at one institution, the study aims to inform the development of an effective strategy for user research and content management.  相似文献   

16.
Web2.0为用户提供了各种互动平台,使得用户形成社会化的群体聚合效应。本文从用户的群体性理论出发,研究网络用户群体行为,对Web2.0环境下的网络用户群体进行分类,研究了网络群体的特征,探讨了Web2.0环境下用户群体化表现,对其生命周期进行了分析,最后从群体动力学角度构建了Web2.0环境下网络用户的群体动力模型,有利于从宏观角度认识网络群体的演化趋势。  相似文献   

17.
Online display advertising is a multi-billion dollar industry where advertisers promote their products to users by having publishers display their advertisements on popular Web pages. An important problem in online advertising is how to forecast the number of user visits for a Web page during a particular period of time. Prior research addressed the problem by using traditional time-series forecasting techniques on historical data of user visits; (e.g., via a single regression model built for forecasting based on historical data for all Web pages) and did not fully explore the fact that different types of Web pages and different time stamps have different patterns of user visits. In this paper, we propose a series of probabilistic latent class models to automatically learn the underlying user visit patterns among multiple Web pages and multiple time stamps. The last (and the most effective) proposed model identifies latent groups/classes of (i) Web pages and (ii) time stamps with similar user visit patterns, and learns a specialized forecast model for each latent Web page and time stamp class. Compared with a single regression model as well as several other baselines, the proposed latent class model approach has the capability of differentiating the importance of different types of information across different classes of Web pages and time stamps, and therefore has much better modeling flexibility. An extensive set of experiments along with detailed analysis carried out on real-world data from Yahoo! demonstrates the advantage of the proposed latent class models in forecasting online user visits in online display advertising.  相似文献   

18.
Web日志挖掘数据预处理方法研究     总被引:1,自引:0,他引:1  
Web日志挖掘技术是Web数据挖掘中最重要的应用。通过对挖掘服务器日志文件的分析和研究,可以对网站的组织结构及其性能进行改进,增加个性化服务,发现潜在的读者群体。数据预处理关系到Web日志挖掘的质量。数据预处理包括数据清理、识别用户、识别用户会话、格式化,目的是分割服务器日志为多个独一无二的用户的一次访问序列,并给予了算法实现。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号