首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
Web日志挖掘与传统数据挖掘的区别在于数据源不同,Web日志挖掘的对象通常是服务器的日志信息,而传统数据挖掘的对象多为数据库。日志挖掘主要分为三个步骤:数据预处理、模式识别和模式分析。数据预处理这个环节是整个过程的基础和实施有效挖掘算法的前提,在Web日志挖掘中起着非常重要的作用。为此,本文深入探讨了数据预处理环节的主要任务,提出了一种新Web挖掘预处理方案。  相似文献   

2.
Web日志挖掘是Web数据挖掘的重要分支,已成为研究人员关注的焦点。本文首先分析了Web日志的格式,再对Web日志挖掘过程中的数据预处理进行了深入的讨论,最后阐述了Web日志挖掘在网站建设上的应用。  相似文献   

3.
WEB日志挖掘技术及其应用研究   总被引:2,自引:0,他引:2  
Web日志挖掘是Web数据挖掘的重要分支,已成为研究人员关注的焦点。本文对日志挖掘过程中的数据预处理和模式发现进行了深入的讨论,并总结了Web日志挖掘在网站建设和维护方面的应用。  相似文献   

4.
Web日志挖掘是Web数据挖掘的重要分支,已成为研究人员关注的焦点、本文对日志挖掘过程中的数据预处理和模式发现进行了深入的讨论.并总结了Web日志挖掘在网站建设和维护方面的应用,  相似文献   

5.
Web日志挖掘数据预处理技术的研究   总被引:1,自引:0,他引:1  
在Web数据挖掘研究领域中,数据预处理在Web日志挖掘过程中起着至关重要的作用,深入探讨了数据预处理环节的过程,并介绍一种由用户访问序列直接生成用户访问事务的算法.  相似文献   

6.
本文对传统预处理步骤和方法进行了分析,针对其所需解决的两个基本问题:用户的准确识别与追踪和本体化的Web信息与基础日志数据的结合,提出了适合网络社区用户兴趣挖掘研究的数据预处理步骤与方法,弥补传统Web使用挖掘数据预处理在这方面的不足.  相似文献   

7.
数字图书馆个性化服务与Web日志挖掘数据预处理技术   总被引:2,自引:0,他引:2  
柳胜国 《现代情报》2007,27(7):65-67
通过对挖掘服务器日志文件的分析和研究,可以对网站的组织结构及其性能进行改进,增加个性化服务,发现潜在的读者群体,建立数字图书馆个性化服务的用户模式。数据预处理关系到Web日志挖掘的质量。数据预处理包括数据清理、识别用户、识别用户会话、格式化,目的是分割服务器日志为多个独一无二的用户的一次访问序列。  相似文献   

8.
基于Web的数据挖掘是一个结合了数据挖掘和WWW的热门研究课题。本文介绍了Web数据的特点及Web数据挖掘研究的三种分类:Web内容挖掘、Web结构挖掘、Web使用挖掘。总结介绍了Web日志挖掘的常用数据挖掘技术。  相似文献   

9.
本文以Web日志挖掘为着眼点,以用户访问日志记录为数据源,提出了一种即可获得用户频繁访问路径,又可对具有相似行为用户进行聚类的Web日志挖掘模型,并重点对其中的采样模块、预处理模块和挖掘模块给出了具体实现方法。最后将研究成果应用于某学院数字图书馆网站,实践证明取得了较明显效果,达到了预期收益,为同类研究提供了一种有益参考。  相似文献   

10.
Web日志挖掘预处理中复杂问题的解决方法   总被引:1,自引:0,他引:1  
徐志玮 《现代情报》2008,28(6):79-81
随着网络的日益普及和信息技术的进步,Web日志挖掘的数据收集和原始数据处理工作变得越来越复杂,使得预处理技术也要进行相应的提高.本文通过对预处理中出现的复杂问题,进行了详细的分析,并列出了目前比较成熟的算法.  相似文献   

11.
研究利用Web日志文件来进行CRM数据挖掘是很有实际应用价值的,本文从这种实际需求出发,提出在数据预处理过程中使用启发式规则来识别用户,并介绍了一种基于IIS本身配置进行数据采集的方法。  相似文献   

12.
介绍了当前Web数据挖掘所采用的三种数据收集方法:Web日志挖掘,packet sniffer技术以及如何从应用服务器端收集数据。在分析Web日志挖掘不足的基础上对后面两种数据收集方法进行了研究,最后结合从服务器端收集数据的方法构建了一种基于用户会话的数据挖掘模型,为企业更好地理解客户行为提供相对可靠的依据。  相似文献   

13.
介绍了当前Web数据挖掘所采用的三种数据收集方法:Web日志挖掘,packet sniffer技术以及如何从应用服务器端收集数据.在分析Web日志挖掘不足的基础上对后面两种数据收集方法进行了研究,最后结合从服务器端收集数据的方法构建了一种基于用户会话的数据挖掘模型,为企业更好地理解客户行为提供相对可靠的依据.  相似文献   

14.
Web挖掘一般可以分为3类:Web内容挖掘、Web结构挖掘和Web使用挖掘。WWW上信息资源的爆炸性增长,Web挖掘已经成为计算机科学的一个重要研究领域。使用模式挖掘是Web挖掘的一个分支,它利用Web服务器的日志中的大量数据及其他相关数据集进行分析挖掘,并从中获得有价值的有关网站访问使用情况的模式知识。对Web数据挖掘作了比较详细的介绍,并介绍了Web使用挖掘各阶段的主要工作以及相关技术。  相似文献   

15.
Web数据挖掘与高校数字图书馆个性化服务   总被引:2,自引:0,他引:2  
欧阳烽 《现代情报》2008,28(1):103-104,107
针对高校数字图书馆个性化服务的实现,首先介绍Web数据挖掘和个性化服务的相关概念及特点,再详细叙述Web日志挖掘的相关算法及过程,最后指出Web数据挖掘是高校数字图书馆进行个性化服务的主要途径.  相似文献   

16.
基于Web日志挖掘的网络动态竞争情报分析研究   总被引:1,自引:0,他引:1  
通过挖掘蕴含在WebE1志中的隐含模式和知识,Web日志挖掘为企业实现网络竞争情报动态分析提供了一种有效的途径。文章分析Web日志挖掘的原理和过程,并探讨Web日志挖掘在动态竞争情报分析中的应用。  相似文献   

17.
Web用户行为模式挖掘是在Web日志挖掘基础上的应用研究,是以网络日志为研究对象,从用户的访问记录中提取感兴趣内容的挖掘模式。E—Learning是指通过因特网或其它数字化内容进行的学习与教学活动。从Web用户行为模式挖掘方法及流程入手,对该方法进行了详细的阐述。将这些方法运用到E—Learning系统中,构建出一种基于Web用户访问模式挖掘的模型,实现从E-Learning系统的日志文件中挖掘出有用的数据,这些数据可为教育决策和教育教学优化提供信息和知识服务。  相似文献   

18.
构建基于Web数据挖掘的信息服务系统   总被引:2,自引:1,他引:2  
黄媛 《情报探索》2004,(4):109-110
介绍了Web数据挖掘的种类和方法,建立一个基于Web数据挖掘的信息服务系统。以数据挖掘模块为中心,处理数据库、智能代理、Web服务器日志和用户接口多数据源的信息,以改善信息服务机构的服务质量。  相似文献   

19.
李玉霞  李红宇 《科技通报》2012,28(2):149-151
Web日志中包含了大量的用户浏览信息,如何有效地从中挖掘出用户浏览模式就尤为重要了。本文在分析现有用户浏览模式挖掘算法存在问题的基础上,根据Web日志的特点,对关联规则挖掘算法进行改进,提出了基于滑动窗口的浏览模式挖掘算法TBPM。并在此算法基础上设计了增量更新算法,对实际数据的实验结果验证了本算法的有效性。  相似文献   

20.
基于XML的Web日志知识获取集成系统   总被引:2,自引:0,他引:2  
XML的出现解决了异构平台间数据交换的问题,在此基础上发展起来的各种应用技术能够对数据提取、传递、转换和展示提供有效支持。在分析了Web日志挖掘技术后,以XML为基础,提出了一种Web日志知识获取集成系统的模型。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号