首页 | 本学科首页   官方微博 | 高级检索  
     检索      

Web使用挖掘数据预处理中的一种会话识别改进算法
引用本文:周青,姚力文,黄龙军,肖燕.Web使用挖掘数据预处理中的一种会话识别改进算法[J].科技广场,2008(7).
作者姓名:周青  姚力文  黄龙军  肖燕
作者单位:1. 南昌大学信息工程学院计算机系,江西,南昌,330031
2. 江西师范大学软件学院,江西,南昌,330000
3. 江西省经济管理干部学院,江西,南昌,330031
摘    要:本文论述了Web用户访问模式挖掘中的数据预处理,主要提出了数据预处理中如何识别会话的一种改进算法。该方法通过使用三个因素来构造会话:①根据先验知识,确定会话时间阈值识别会话;②根据页面访问时间统计分布,确定相邻网页访问时间间隔阈值识别会话;③页面内容及站点结构确定页面重要程度识别会话。实验结果表明,相对于传统的单一方法进行会话识别的方法,该方法能够准确的识别会话,更为合理有效。

关 键 词:访问模式挖掘  数据预处理  会话识别  阈值  网站结构

An Improved Algorithm for Session Identification in Data Preparation of Web Usage Mining
Zhou Qing,Yao Liwen,Huang Longjun,Xiao Yan.An Improved Algorithm for Session Identification in Data Preparation of Web Usage Mining[J].Science Mosaic,2008(7).
Authors:Zhou Qing  Yao Liwen  Huang Longjun  Xiao Yan
Abstract:
Keywords:
本文献已被 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号