首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 156 毫秒
1.
Web用户访问模式挖掘技术可以从服务器、浏览器端的日志记录中自动发现用户的访问偏好、兴趣和趋势等信息,目前已经成为web挖掘领域的一个研究热点.文章首先给出Web访问模式挖掘系统的一般框架模型,然后介绍了框架模型中主要组成部分的工作原理,在此基础上,对Web访问模式挖掘系统中的一些关键技术的最新研究进展状况作了阐述和分析,其中包括数据采集、数据预处理、模式发现、用户可视化界面等,最后分析了未来该领域的研究重点作了展望.  相似文献   

2.
Web站点用户浏览模式自动分类可以更好地组织站点上的内容信息来满足不同用户的访问需求.Web使用挖掘技术已经在这项研究中得到了广泛的应用,但是集成Web内容挖掘的成果还不多见.本文首先给出了结合Web内容和使用挖掘技术的用户浏览模式分类的原型系统框架.系统中主要的过程是:对数据集中原始的Web服务器日志进行清理,使用Web使用挖掘技术从用户浏览会话中挖掘出有代表性的用户浏览模式,根据模式中每一个相关的页面内容抽取出一个N-gram集合,构建基于N-gram的用户浏览模式简档.最后本文对用户浏览会话作了分类实验分析,实验结果表明这个方法在N-gram=6,df=10%的情况下取得了较高的分类精确度.  相似文献   

3.
论基于Web用户访问信息挖掘技术的个性化定制服务   总被引:6,自引:0,他引:6  
本文论述了Web用户信息探索的内容和用户访问模式挖掘的实现方法,从几个方面分析了Web用户访问模式的发现技术在个性化定制服务中的应用。展望了Web访问信息挖掘技术的成熟对个性化定制服务水平的前景。  相似文献   

4.
Web使用挖掘是利用数据挖掘技术从Web数据中发现用户使用模式的过程。以Web使用挖掘技术为基础,提出了一种个性化服务推荐模型。分析了Web使用挖掘的数据收集、数据预处理、模式发现及分析、个性化服务引擎等过程,并对各过程的个性化服务的实现进行了阐述,还对个性化服务的发展进行了展望。  相似文献   

5.
搜索引擎日志记录了用户与系统交互的整个过程。对日志文件进行挖掘,可以发现用户进行Web搜索的行为特征与规律,有效改善搜索引擎系统的性能。在对国内外相关研究进行系统梳理和总结的基础上,文章提出了一个Web搜索引擎日志挖掘的研究框架,主要包括日志挖掘的研究内容、数据集的选择方法、数据预处理的方法、不同地域用户行为的特征与比较、如何应用于系统性能的改善等内容。  相似文献   

6.
吕艳丽 《图书馆学刊》2006,28(4):135-137
Web使用挖掘过程包括数据预处理、模式发现和模式分析;利用Webalizer和Webtrends等Web使用分析工具可以对用户模式进行分析,为建立个性化系统提供依据;国内外典型的个性化系统平台为图书馆的个性化系统提供较好的范例。  相似文献   

7.
Web数据应用的利器--Web数据挖掘   总被引:1,自引:0,他引:1  
张娥  冯耕中  战子玉 《情报学报》2002,21(6):686-690
Web已经成为世界上最大的信息仓库之一 ,但是随着信息量的增长 ,人们有效使用Web信息也越来越困难。Web数据挖掘为人们使用Web中的显性和隐性信息提供了一把利器。本文介绍了Web挖掘提出的背景、领域内研究分支学科状况、研究内容、研究难点和国内外的研究现状。  相似文献   

8.
目前许多CBR系统面临着案例过时、数量停滞、用户参与程度低等可持续性发展问题。为了鼓励用户参与CBR系统的使用,促进CBR系统的发展,提出了一种基于Web2.0技术和文本挖掘的CBR系统框架。利用该框架可以提高用户体验。案例分析结果显示,文本挖掘和Web2.0技术可以为CBR系统带来额外的价值,并对CBR系统的开发和设计提供了新的思路。  相似文献   

9.
阮光册 《图书情报工作》2011,55(11):121-124
网络用户行为研究大多采用Web用户日志挖掘,首先介绍Web关联规则应用的传统方法,并指出传统方法中忽略了用户兴趣这一因素研究,更多的是以网页高频出现为挖掘结果进行聚类。针对这一问题,提出一种基于Web关联规则挖掘、页面内容和会话相似度相结合的研究方法,聚类出用户频繁访问的页面组,以发现网络用户行为的规律。在案例应用中,以上海某高校学生网络行为研究为例,得出相关结论。  相似文献   

10.
Web使用挖掘下的Web页面层次分类技术研究   总被引:1,自引:0,他引:1  
Web使用挖掘研究用户访问行为所体现的行为特征,Web站点结构分析对于Web使用挖掘具有重要意义.本文讨论如何结合Web站点内页面间的超链结构和关键页面分析技术实现对Web站点的链接结构分析,得到清晰的站点拓扑结构和页面层次分类,进而以此为Web页面进行层次编码,和Web用户行为向量的建立方法,为准确表述用户的访问行为提供数据支持;用一种新的方式进一步有效的挖掘用户的行为特征.最后,把它同一些重要的页面分类方法,从算法的计算效率和页面分类的准确率上进行了比较,试验数据的分析表明,该方法在效率和准确率上有一定提高.  相似文献   

11.
指出Web挖掘是从数据挖掘发展而来,是集合Web技术、数据挖掘、信息科学等多领域为一体的一项综合技术;介绍Web挖掘的概念、分类以及Web页面之间链接结构挖掘的HITS与Page-rank等算法;提出基于样本模式特征提取的信息检索方法。最后,分析Web链接挖掘面临的问题和未来研究的发展趋势。  相似文献   

12.
构建基于Web数据挖掘技术的信息服务系统   总被引:5,自引:0,他引:5  
介绍Web数据挖掘的种类和方法,提出一个基于Web数据挖掘的信息服务系统结构,该结构以数据挖掘模块为中心,处理数据库、智能代理、Web服务器日志和用户接口多数据源的信息,以改善文献情报机构的服务质量。  相似文献   

13.
基于Web挖掘技术的用户兴趣本体学习研究   总被引:2,自引:1,他引:1  
目前针对基于关键词的用户模型不能从语义上表达用户需求真正内涵,基于领域本体的用户模型多数忽略研究概念间非分类关系和语义应用环境较分散等缺陷。本文提出一种循环式的基于Web挖掘技术的用户兴趣本体学习模型,即综合应用统计分析、关联规则和聚类分析等技术进行电子商务领域用户兴趣概念及概念间分类与非分类关系学习,面对用户兴趣的迅速变化,还提出一种传递激活方法来实时更新本体或重新进行本体学习,以不断提高该本体的质量。经验证,基于该本体的用户模型在文本过滤等应用中能较上述两种用户模型满足用户个性化服务需求。  相似文献   

14.
王仁武  袁毅 《图书馆论坛》2011,31(4):100-102
用户访问行为信息记录在Web日志中,通过对海量Web日志进行清洗、抽取和加载来构建用户行为数据仓库,并结合文章所提出的用户访问路径概率矩阵模型进行数据挖掘,可以实现智能化的用户行为监控,可以为用户提供及时优质的信息服务。  相似文献   

15.
试论Web中的数据挖掘   总被引:6,自引:0,他引:6  
随着 Internet/Intranet的迅速发展 ,Web已成为一个巨大的信息源 ,如何有效地利用这些信息变得非常重要 ,本文详细介绍了 Web挖掘技术的概念、分类及实现技术 ,并介绍了一些实用的 Web挖掘工具  相似文献   

16.
网络数据挖掘及其在面向Web的知识检索中的应用   总被引:6,自引:1,他引:5  
介绍了网络数据挖掘的含义和相关技术,并着重介绍了网络数据挖掘方法在面向Web的知识检索中的应用:通过对信息源内容与结构的挖掘,对用户访问记录的挖掘,对专家访问的挖掘,发现隐藏在网络数据流背后的知识关联和知识,形成特定知识库,支持知识检索。  相似文献   

17.
Web数据挖掘对Web数据检索的支持作用   总被引:3,自引:0,他引:3  
唐建国  胡芒谷 《情报学报》2004,23(4):452-455
本文在对Web数据检索和Web数据挖掘的技术特性进行简要介绍的基础上 ,阐述了二者之间的主要区别 ,并着重对Web数据挖掘对Web数据检索构成的支持作用进行了具体分析。这些支持作用体现在 :自动分类 ,揭示知识特征 ,群集处理 ,超链结构挖掘和用户知识模型挖掘。  相似文献   

18.
以SSCI、IEEE、CNKI、国家自然科学及社会科学基金等为数据源,搜集、整理、统计、分析以Web挖掘为主题的科研论文与科研项目。研究发现:国内外关于Web挖掘研究具有相似的发展轨迹,均经历了萌芽期、发展期、成熟期及回落期;Web挖掘研究重心由早期关注基础理论与基础应用为主,转向以特定领域的特定理论与应用研究的补充与完善为主;大数据、云计算及物联网等新兴技术与Web挖掘的有机融合已成为不可逆转的趋势;Web挖掘研究的主要应用领域发生了很大变化。  相似文献   

19.
一个新的基于协作过滤的用户浏览预测模型   总被引:2,自引:0,他引:2  
本文提出了一个新的基于协作过滤的用户浏览协作预测模型———UNCPM ,它有效地解决了目前协作过滤预测方法的准确性和覆盖率低等问题。UNCPM从Web日志中获取用户浏览信息 ,系统分为两个部分 :离线构件和在线构件。离线构件用于用户浏览历史记录的K means聚类 ,并在聚类时充分考虑URL的相似分析来避免协作过滤的同义性和分散性等不足 ;在线构件用于活动用户预测。该模型可以应用在大型电子商务网站的用户浏览预测上。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号