首页 | 本学科首页   官方微博 | 高级检索  
     检索      

一种基于XML的Web信息抽取方法
引用本文:李剑波,李小华,董树明,杨科华.一种基于XML的Web信息抽取方法[J].情报杂志,2006,25(8):49-51.
作者姓名:李剑波  李小华  董树明  杨科华
作者单位:1. 湖南文理学院计算机教学部,常德,415000
2. 东南大学计算机科学与工程系,南京,210096
摘    要:目前Web资源含有大量的有用信息,但由于它们欠结构化,不能为传统的数据库型查询系统所利用。针对这一问题,出现了Web信息抽取技术。在论述了半结构化Web信息抽取技术总体解决方案的基础上,研究了Web信息抽取的实现技术,并从应用的角度提出一种新的半结构化信息获取方法。该方法包括网页分析过程、映射的自动生成和信息抽取过程。在Web信息抽取的实现部分,提出了抽取规则执行算法,为进一步满足Web信息检索提供了一种新的高效的检索方法。

关 键 词:Web信息抽取  抽取规则  半结构化

Study of Semi-Structured Information Extraction Process Based-on XML
Li JianBo;Li XiaoHua;Dong ShuMing;Yang KeHua.Study of Semi-Structured Information Extraction Process Based-on XML[J].Journal of Information,2006,25(8):49-51.
Authors:Li JianBo;Li XiaoHua;Dong ShuMing;Yang KeHua
Abstract:
Keywords:XML
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号