期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

阮梦黎《科技通报》2015,(4)

随着大数据信息技术的发展,数据在线监测和数据挖掘成为计算机信息领域研究的热点。通过对Web热点数据分割挖掘,提高信息热点追踪和Web数据分类能力。传统算法采用非结构化数据挖掘算法,无法有效对Web热点数据进行准确定位和分层挖掘。提出一种基于半结构化分割的Web热点数据挖掘算法。采用半结构化数据进行特征分割,基于优秀基因位进行差分进化,使寻优曲线不断趋于平缓,在多个节点上并行的运行比较脚本,采用半结构化分割,使得Web热点特征挖掘实现自适应寻优,得到Web热点数据的分配因子,提高了挖掘性能。仿真结果表明,该算法获得了良好的效率和精度,提高了Web热点数据挖掘的自适应寻优能力。相似文献

2.

XML与Web数据挖掘技术

李翔王晓佺《内江科技》2006,27(7):129-130

Web数据挖掘已经成为当前被广泛研究的课题。Web上半结构化的数据结构给Web数据挖掘带来了诸多困难,XML的出现为面向Web的数据挖掘带来了便利。本文介绍了XML语言的特点,及其在Web的数据挖掘中的作用。相似文献

3.

XML技术在Web数据挖掘中的应用

王晓东江元徐超《中国科技信息》2008,(18)

Web数据挖掘技术是当前的热点研究之一.但Web数据本身具有半结构化、组织性差的特点,使得Web数据挖掘工作变得十分困难.而XML的出现为面向Web的数据挖掘带来了便利.本文提出了一种基于XML的Web数据挖掘模型,并通过实例演示其实现步骤. 相似文献

4.

Web挖掘技术探讨

张春明《今日科苑》2007,(22):167-167

随着Internet的迅猛发展,web挖掘逐渐成为数据挖掘的热点,但是因为Web自身的特点:多数据源,数据结构的半结构化,及动态性等种种,Web挖掘又是一个难点。本文从web挖掘的内涵入手简要介绍了web挖掘的目标、相似文献

5.

数据挖掘中的应用

王晓东江元徐超《中国科技信息》2008,(18)

web数据挖掘技术是当前的热点研究之一。但web数据本身具有半结构化、组织性差的特点,使得web数据挖掘工作变得十分困难。而XML的出现为面向web的数据挖掘带来了便利。本文提出了一种基于XML的Web数据挖掘模型,并通过实例演示其实现步骤。相似文献

6.

一种基于XML的Web信息抽取方法 总被引：4，自引：2，他引：4

李剑波李小华董树明杨科华《情报杂志》2006,25(8):49-51

目前Web资源含有大量的有用信息,但由于它们欠结构化,不能为传统的数据库型查询系统所利用。针对这一问题,出现了Web信息抽取技术。在论述了半结构化Web信息抽取技术总体解决方案的基础上,研究了Web信息抽取的实现技术,并从应用的角度提出一种新的半结构化信息获取方法。该方法包括网页分析过程、映射的自动生成和信息抽取过程。在Web信息抽取的实现部分,提出了抽取规则执行算法,为进一步满足Web信息检索提供了一种新的高效的检索方法。相似文献

7.

Web文本挖掘技术研究 总被引：1，自引：0，他引：1

邹腊梅肖基毅龚向坚《情报杂志》2007,26(2):53-55

WWW上的信息量迅猛增长,Internet成为一个拥有大量Web文本资源的巨型数据库。大量异构、非结构化的Web文本对数据挖掘技术提出新的挑战。分析了Web文本的特点、Web文本挖掘的一般流程以及Web文本挖掘中的关键技术。相似文献

8.

基于XML的无监督数据抽取研究

郭东峰《黑龙江科技信息》2013,(17):140-140

本文阐述了利用XML将半结构化Web数据转化为结构化的XML数据,介绍了目前Web数据抽取的最新技术及特点,并对无监督学习网页重复模式发现网页内在模板抽取方法进行了深入的研究和探讨。相似文献

9.

基于XML的网页数据挖掘 总被引：1，自引：0，他引：1

熊一利徐鹏《科技广场》2010,(1):73-75

随着Internet的迅速发展,使得数据丰富而信息贫乏这对矛盾显得日益突出,数据挖掘技术正是应了这一需求而结合了机器学习、模式识别、统计学、人工智能、神经网络等多学科而出现的一项新技术,基于Web的数据挖掘是数据挖掘技术在网络信息处理中的应用。本文叙述了Web数据挖掘的概念、分类、技术等,重点讨论了基于XML语言的Web数据挖掘技术,解决了Internet上绝大多数非结构化甚至是无结构的、Web信息的组织结构性差而导致的Web数据挖掘困难的问题。相似文献

10.

基于启发式规则的多记录页面分隔符识别方法

胡大洋《人天科学研究》2009,(9)

从半结构化或者非结构化的Web文档中提取信息时通常要求指定记录集的边界符,如果不根据记录边界符将包含多记录的页面分成单个记录块,那么记录的提取就不能成功。介绍了一种根据启发式的规则发现Web文档中的记录分隔符的方法,能够很好地解决多记录页面记录分割的问题。相似文献