首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 31 毫秒
1.
基于Web文本挖掘的企业竞争情报获取方法研究   总被引:1,自引:0,他引:1  
本文从Web数据挖掘方法入手,介绍了企业竞争情报的获取方法,包括基于Web内容挖掘的获取方法、基于Web结构挖掘的获取方法和基于Web使用记录挖掘的获取方法,进而研究了基于web文本挖掘的竞争情报获取步骤,最后剖析了基于Web文本挖掘的企业竞争情报中客户知识获取的案例。  相似文献   

2.
介绍了文本数据挖掘和知识提取的基本理论,然后分析了网络信息的检索与挖掘的特征,特别是文本挖掘、Web数据挖掘和基于内容数据挖掘与之相关联的系列问题.在此基础上,分析了Web知识库的设计、建立、文本数据挖掘和知识发现所需的理论和技术,对Web知识库系统的架构和功能模块进行分析和设计,建立了基于文本数据挖掘的Web网络知识库的模型.  相似文献   

3.
Web网络中存在海量文本,需要进行合理高效的文本抽取,实现Web文本数据挖掘。由于Web文本数据的高维特性,文本抽取过程中自动分类配对困难。提出一种基于RBF神经网络隐节点共振致密配对的Web数据文本抽取算法,进行Web数据文本特征采样与关联主特征挖掘,在每次移动中形成RBF隐节点共振致密配对,得到最优文本特征选择的路径,建立RBF神经网络分类器,实现基于蚁群算法的特征抽取算法改进。实验结果表明,该算法能有效实现对隐节点的共振致密配对,特征挖掘跟踪性能较好,保障了挖掘性能,系统所提取的特征分量与其他模糊分量差距较小,文本正确抽取召回率高于传统方法,在Web网络数据文本抽取中具有优越可靠的应用价值。  相似文献   

4.
聚类分析在Web文本挖掘中的应用   总被引:2,自引:0,他引:2  
徐海霞 《情报杂志》2004,23(12):99-101
在区分Web挖掘与数据挖掘的基础上,较详细地分析了Web文本挖掘的过程,并给出了一个具体的Web文本挖掘模型。重点在介绍聚类分析的基础上,以PCCS为算法原型分析了聚类分析在Web文本挖掘中的具体应用。  相似文献   

5.
基于Web文本挖掘技术的企业竞争情报系统研究   总被引:9,自引:2,他引:9  
分析了企业竞争情报系统的现状,介绍了Web挖掘基本概念并分析了Web文本挖掘的关键技术,然后结合Web文本挖掘技术设计企业竞争情报系统结构模型与方案。  相似文献   

6.
对Web网页抓取是实现Web文本特征数据检索的最佳方式,Web网页抓取路径损耗误差的优化估计可以提高对Web数据的挖掘性能。传统方法中,对Web网页抓取采用基于线性滤波检测的单模匹配抓取方法,受弱信号幅度和临界阈值约束,路径损耗较大,且无法有效实现路径损耗误差有效估计。提出一种基于叠加编码特征统计的Web网页抓取路径损耗误差估计算法。构建Web网页文本特征抓取的目标函数,进行Web网络路径损耗模型构建,设计叠加编码算法进行特征统计,得到Web网页抓取路径概念格。仿真实验表明,该算法能有效提高Web网页抓取路径损耗误差估计精度,进而提高了Web网页文本数据抓取的查准率和文本特征数据的挖掘性能。  相似文献   

7.
Web文本挖掘技术研究   总被引:1,自引:0,他引:1  
WWW上的信息量迅猛增长,Internet成为一个拥有大量Web文本资源的巨型数据库。大量异构、非结构化的Web文本对数据挖掘技术提出新的挑战。分析了Web文本的特点、Web文本挖掘的一般流程以及Web文本挖掘中的关键技术。  相似文献   

8.
李元臣  刘维群 《情报杂志》2006,25(12):28-29
网络文本挖掘是从非结构化的文本中发现潜在的、有价值知识的一种有效技术,要使检索到的信息在满足用户个性化需求方面,既具有高准确率又有高回收率,则是一件很困难的事情。为了解决以上问题,在介绍特征提取概念的基础上提出了一个基于遗传算法的Web文本特征抽取算法,该算法进一步提高了Web文本的处理效率。  相似文献   

9.
章成志 《情报杂志》2004,23(4):2-4,8
针对当前Web文本挖掘工具的不足之处 ,提出了一种基于层次结构、面向主题挖掘的模型 ,即文本层次模型TLM ,给出该模型中各层次含义、层间关系及实现方法 ,描述了各层中所包含的噪声及过滤方法 ,介绍了利用该模型进行基于概念语义网络的自动标引和自动分类的研究情况 ,总结了TLM模型的优点和有待改进的地方。  相似文献   

10.
文本挖掘在Web中的技术分析   总被引:1,自引:0,他引:1  
根据调查,各领域的信息存储约有80%包含在文本文档中,文本挖掘因此也被认为比数据挖掘具有更高的商业潜力。作为从浩瀚的Web信息资源中发现潜在的、有价值知识的一种有效技术,Web领域的挖掘技术正悄然兴起,备受关注。本文重点阐述文本挖掘在Web中对信息抽取、挖掘过程及超文本挖掘技术的分析及应用。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号