首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 187 毫秒
1.
基于高校图书馆Web日志挖掘的分析与研究   总被引:1,自引:0,他引:1  
以长江大学图书馆主页服务器Web日志文件为例,介绍了Web日志分析流程、Web日志格式,分析了Web日志挖掘的数据预处理过程,最后给出了应用实例。  相似文献   

2.
通过对数字图书馆的日志记录现状进行分析,找到目前存在的问题,进而提出基于XML的用户日志格式,并将该日志格式应用于实验系统,通过用户使用该实验系统收集一定量的用户行为数据。  相似文献   

3.
企业邮件系统中每天都要产生大量的日志,通过对日志的分析能够获取用户、设备甚至是潜在安全风险等信息,由于日志量大,采用传统的日志分析方法已难以满足企业需求。随着Hadoop平台技术的成熟,通过大数据技术能够实现对大数据量日志的分析。本文以邮件系统中用户访问日志为例,通过Hadoop平台的构建,使用Hive实现了对该日志的分析,有助于发现邮件系统中潜在的安全风险,保障系统的稳定运行。  相似文献   

4.
Web日志挖掘数据预处理方法研究     总被引:1,自引:0,他引:1  
Web日志挖掘技术是Web数据挖掘中最重要的应用。通过对挖掘服务器日志文件的分析和研究,可以对网站的组织结构及其性能进行改进,增加个性化服务,发现潜在的读者群体。数据预处理关系到Web日志挖掘的质量。数据预处理包括数据清理、识别用户、识别用户会话、格式化,目的是分割服务器日志为多个独一无二的用户的一次访问序列,并给予了算法实现。  相似文献   

5.
吕娜 《图书情报工作》2007,51(5):138-141
数字图书馆网站服务系统中存有大量有关用户访问信息的日志文件,通过对这些日志文件的挖掘可以得到有关数字图书馆资源利用情况和用户兴趣的信息。但实际上,这些日志文件很少被利用。针对这一现状,作者对日志文件进行挖掘试验分析,得出用户的频繁下载集合,以用于推荐链接和评价数据库资源。  相似文献   

6.
网络日志分析在网络安全中的作用   总被引:5,自引:0,他引:5  
日志分析作为网络安全防御系统的组成部分,在网络安全中起着重要的作用。本文论述了网络日志文件的重要性,阐述了网络日志文件的分析方法,并提出了日志文件分析的发展趋势。  相似文献   

7.
论文针对图书馆日志多数据源且格式多样化导致的日志处理效率低下的问题,提出了基于ELK的日志综合解决方案。该方案首先探讨了日志采集、数据清洗、日志解析的规则和技巧以及基于TF-IDF、SVM算法设计的日志异常检测模型;其次基于提出方案的整体架构,详细地分析了日志采集、存储、可视化、异常检测的整个流程;最后,将该方案应用于中国矿业大学OPAC系统,对读者用户的检索行为、不良用户的攻击行为进行可视化分析。实验结果表明,论文提出的日志管理解决方案,在集群模式下检索性能极其高效,有效地提高了图书馆日志的处理能力。  相似文献   

8.
文章通过对个性化推荐和数据建模理论研究,分析了普通的Web日志格式采集到的数据无法满足个性化用户分析、预测和推荐精度需要的局限性。提出定制Web日志数据建模的过程及方法,建立了定制Web日志模型原型。通过应用数据挖掘技术的关联分析、分类和聚类实验,实验结果表明,通过定制Web日志的方式采集的数据质量能够很好地满足发现关联规则、内容分类和用户聚类的需求,从而提高个性化推荐的精度。同时,定制的Web日志数据还具有简化数据预处理、多用途的优点。  相似文献   

9.
通过日志挖掘研究图书馆资源发现服务用户的搜索行为   总被引:1,自引:0,他引:1  
通过日志挖掘的方法对图书馆资源发现服务用户的搜索行为进行研究。搭建一个搜索日志中间平台,用于产生和记录相关日志信息;用Java编写日志处理程序,将日志信息存储于MySQL数据库中;基于日志结果,从检索方式、查询语言与查询长度、分面点击、查询词修改等方面对用户搜索行为进行分析,希望能对图书馆资源发现服务的部署、应用和优化提供参考。  相似文献   

10.
数字图书馆用户使用信息挖掘与应用   总被引:5,自引:0,他引:5  
用户信息收集是用户研究中最基础同时也是最重要的环节。数字图书馆有关记录用户活动和行为的日志文件、用户profile和用户调查信息统称为用户使用信息.对这些信息进行挖掘的技术主要是WEB使用挖掘。在数字图书馆中应用WEB使用挖掘可以改善网站可用性,提供个性化服务,进行资源评价与采编,进行数字图书馆系统评价和界面设计。  相似文献   

11.
Web 用户访问模式挖掘技术可以从服务器、浏览器端的日志记录中自动发现用户的访问偏好、兴趣和趋势等 信息,目前已经成为web 挖掘领域的一个研究热点。文章首先给出Web 访问模式挖掘系统的一般框架模型,然后介绍了 框架模型中主要组成部分的工作原理,在此基础上,对Web 访问模式挖掘系统中的一些关键技术的最新研究进展状况作 了阐述和分析,其中包括数据采集、数据预处理、模式发现、用户可视化界面等,最后分析了未来该领域的研究重点作 了展望。  相似文献   

12.
按照标准的服务器日志格式,对图书馆Web服务器日志文件的记录进行分析,并通过对其一定时间段的数据挖掘,对图书馆网站的使用状况进行了有益的探讨。  相似文献   

13.
The Central Medical Library (CMK) at the Faculty of Medicine, University of Ljubljana, Slovenia, started to build a library Website that included a guide to library services and resources in 1997. The evaluation of Website usage plays an important role in its maintenance and development. Analyzing and exploring regularities in the visitors'' behavior can be used to enhance the quality and facilitate delivery of information services, identify visitors'' interests, and improve the server''s performance. The analysis of the CMK Website users'' navigational behavior was carried out by analyzing the Web server log files. These files contained information on all user accesses to the Website and provided a great opportunity to learn more about the behavior of visitors to the Website. The majority of the available tools for Web log file analysis provide a predefined set of reports showing the access count and the transferred bytes grouped along several dimensions. In addition to the reports mentioned above, the authors wanted to be able to perform interactive exploration and ad hoc analysis and discover trends in a user-friendly way. Because of that, we developed our own solution for exploring and analyzing the Web logs based on data warehousing and online analytical processing technologies. The analytical solution we developed proved successful, so it may find further application in the field of Web log file analysis. We will apply the findings of the analysis to restructuring the CMK Website.  相似文献   

14.
Understanding user behavior with electronic services is now a major concern of journal publishers, librarians, and others. Various electronic journal log files are offering researchers and practitioners a rich data resource for user studies. This article reports the experience of using the log file data to understand user behavior in the SuperJournal project, addressing methodological and analytical issues that may have wider relevance. The purpose of this article is to provide guidance for log file processing and analysis focusing on users, and to begin the process of standardizing analysis procedures to facilitate the comparison of user behavior observed in different projects.  相似文献   

15.
在分析Google桌面搜索工具(GDS)运行机制的基础上,提出一种基于GDS开发站内全文搜索引擎的方法:开发一个专用的Web代理GDSProxy,采用接受与转发机制支持用户对GDS搜索服务的远程访问,转发过程中增加用户IP地址限定、身份认证、日志处理和信息过滤等功能,站内信息的挖掘、索引和本地搜索服务由GDS承担。最后,通过开发实例介绍具体实现步骤。  相似文献   

16.
论图书馆用户的网络调查方法   总被引:18,自引:0,他引:18       下载免费PDF全文
图书馆用户网络调查具有范围广、方式灵活、效率较高、成本低、客观性较强、自动化程度较高等特点。网络调查的主要方式有 :电子邮件法、Web站点问卷调查法、网上讨论法、服务器日志统计法、用户注册信息调查法等。参考文献 7  相似文献   

17.
数字图书馆个性化信息检索模型研究*   总被引:3,自引:0,他引:3  
结合向量空间技术、Agent技术、Web日志挖掘等技术提出了一个基于概念的数字图书馆个性化信息检索模型。该模型根据用户主动提供的初始信息建立基于概念的用户兴趣模型,利用用户对文档的主动评价和用户的访问行为更新用户兴趣模型,并将用户兴趣模型用于检索结果的相关度排序和最新信息的推荐以及合作推荐。最后给出系统的实现方法。  相似文献   

18.
在分析关系数据库中MARC数据存储特点的基础上,给出一种MARC数据镜像系统的设计方案。该方案通过引入文件传输服务器使得源数据库和目的数据库在进行数据复制时把远程操作转化成本地操作,把记录同步转化成网络文件传输,使得源数据库和目的数据库之间的数据复制可靠、快速而且有效。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号