共查询到18条相似文献,搜索用时 140 毫秒
1.
Web文本挖掘浅析 总被引:7,自引:0,他引:7
王连军 《现代图书情报技术》2002,18(6):38-40
首先讨论Web挖掘与Web信息检索的关系,然后重点分析Web文本挖掘,并提出Web文本挖掘的方法,包括文本特征表示、文本分类和文本聚类。最后,提出了利用Web挖掘技术实现Web智能化服务和挖掘引擎的应用。 相似文献
2.
3.
4.
Web站点用户浏览模式自动分类可以更好地组织站点上的内容信息来满足不同用户的访问需求.Web使用挖掘技术已经在这项研究中得到了广泛的应用,但是集成Web内容挖掘的成果还不多见.本文首先给出了结合Web内容和使用挖掘技术的用户浏览模式分类的原型系统框架.系统中主要的过程是:对数据集中原始的Web服务器日志进行清理,使用Web使用挖掘技术从用户浏览会话中挖掘出有代表性的用户浏览模式,根据模式中每一个相关的页面内容抽取出一个N-gram集合,构建基于N-gram的用户浏览模式简档.最后本文对用户浏览会话作了分类实验分析,实验结果表明这个方法在N-gram=6,df=10%的情况下取得了较高的分类精确度. 相似文献
5.
6.
7.
针对“基于用户信息服务”的数字图书馆体系结构下信息集成过程中存在的普遍问题.本文提出一种基于XML和Web Services技术、复制集成和模式集成相结合的信息集成模型,重点分析了该模型的结构、各组成部分的功能以及模型的运行机理,并简单说明了该模型在数字图书馆中的应用方式。本文的研究思路对数字图书馆信息集成技术的实现有一定的借鉴意义。 相似文献
8.
Web挖掘技术在电子商务中的应用研究 总被引:16,自引:0,他引:16
本文基于国内外最新研究成果对电子商务中应用的Web挖掘技术进行了研究。对于个性化电子商务网站中难以发现用户行为特征问题 ,给出了基于Web日志的客户群体聚类算法及Web页面聚类算法。利用这些Web挖掘技术可有效挖掘用户个性特征 ,从而指导电子商务网站资源的组织和分配。 相似文献
9.
10.
本文对文本数据挖掘在数字图书馆中的应用进行研究,重点对数字图书馆文本分类的构建与实现进行研究,并将开方拟合检验方法、KNN分类算法等经典理论应用到数字图书馆文本分类模型中,以提高数字图书馆检索能力及检索准确性。 相似文献
11.
数字图书馆个性化信息检索模型研究* 总被引:3,自引:0,他引:3
许春漫 《现代图书情报技术》2006,1(3):15-19
结合向量空间技术、Agent技术、Web日志挖掘等技术提出了一个基于概念的数字图书馆个性化信息检索模型。该模型根据用户主动提供的初始信息建立基于概念的用户兴趣模型,利用用户对文档的主动评价和用户的访问行为更新用户兴趣模型,并将用户兴趣模型用于检索结果的相关度排序和最新信息的推荐以及合作推荐。最后给出系统的实现方法。 相似文献
12.
[目的/意义]移动视觉搜索能有效地帮助用户从海量的文本、图像和视频等视觉数据中快速找到其感兴趣的信息,对其进行系统研究,能丰富和深化数字图书馆信息检索理论和信息服务思想。[方法/过程]介绍数字图书馆移动视觉搜索的应用需求及表现形式,探讨移动视觉搜索研究历程及其在数字图书馆情境中的重要性,并对数字图书馆移动视觉搜索机制的内涵、分类与架构设计等进行分析。[结果/结论]提出应从移动环境软硬件资源局限性、用户需求多样性、移动用户体验质量、互操作性、协同管理等5方面着手建设数字图书馆移动视觉搜索机制。 相似文献
13.
Web抽取技术在数字图书馆中的应用 总被引:2,自引:0,他引:2
从Web页面中挖掘有价值的信息是数字图书馆技术应用的一个重要方式。目前Web页面信息描述大多教是用XML表示的,Web数据抽取技术是Web信息挖掘的关键,文章提出了一种面向HTML或XML描述的web页面的web数据抽取模型并阐述了实现过程。 相似文献
14.
网络文本数据分类技术与实现算法 总被引:23,自引:2,他引:21
本文主要论述网络文本数据挖掘中的文本分类技术原理、方法 ,同时给出实现文档分类和类型匹配的若干算法 ,最后介绍文本分类正确率评价指标以及网络文本数据检索系统应用实证测评分析。 相似文献
15.
16.
虚拟图书馆中网页的自动分类研究 总被引:1,自引:0,他引:1
臧国全 《现代图书情报技术》2002,18(3):28-31
概括了国内外对电子文本及Web网页进行自动分类的研究和试验,论述了虚拟图书馆中对网页进行自动分类与一般搜索引擎中对网页进行自动分类的区别,提出了一种用于虚拟图书馆中对网页进行自动分类的方法,并描述了按照此方法建立的“图书馆学情报学”虚拟图书馆的自动分类系统,对分类结果进行了分析。 相似文献
17.
读者需求分析中的数据挖掘技术 总被引:4,自引:0,他引:4
黄咏梅 《大学图书情报学刊》2006,24(4):48-50
针对高校图书馆读者借阅文献类型、流量实时监测问题,提出了一种基于数据挖掘中聚类算法的自动分类和统计分析方法.以方法开发出流量分类统计和预报应用系统,在大庆石油学院图书馆进行了实际应用,结果证明了该算法是有效和可靠的. 相似文献
18.
在数字图书馆Web 学术信息资源的优化采集中,有效结合网页空间特征、内容特征和标签信息对网页进
行分块,研究对分块结果进行识别和合并,然后输出网页的主题文本和相关链接块集合,最后通过实验分析该方法能
够进一步去除页面中噪音、准确地分析页面的主题相关性和提高Web 主题信息采集的质量。 相似文献