一种基于XML的Web信息抽取方法 Study of Semi-Structured Information Extraction Process Based-on XML期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

一种基于XML的Web信息抽取方法

引用本文：	李剑波,李小华,董树明,杨科华.一种基于XML的Web信息抽取方法[J].情报杂志,2006,25(8):49-51.

作者姓名：	李剑波李小华董树明杨科华

作者单位：	1. 湖南文理学院计算机教学部,常德,415000 2. 东南大学计算机科学与工程系,南京,210096

摘要：	目前Web资源含有大量的有用信息,但由于它们欠结构化,不能为传统的数据库型查询系统所利用。针对这一问题,出现了Web信息抽取技术。在论述了半结构化Web信息抽取技术总体解决方案的基础上,研究了Web信息抽取的实现技术,并从应用的角度提出一种新的半结构化信息获取方法。该方法包括网页分析过程、映射的自动生成和信息抽取过程。在Web信息抽取的实现部分,提出了抽取规则执行算法,为进一步满足Web信息检索提供了一种新的高效的检索方法。
关键词：	Web信息抽取抽取规则半结构化
Study of Semi-Structured Information Extraction Process Based-on XML

Li JianBo;Li XiaoHua;Dong ShuMing;Yang KeHua.Study of Semi-Structured Information Extraction Process Based-on XML[J].Journal of Information,2006,25(8):49-51.

Authors:	Li JianBo;Li XiaoHua;Dong ShuMing;Yang KeHua

Abstract:

Keywords:	XML
本文献已被 CNKI 维普万方数据等数据库收录！