浅谈基于XML的web页面信息抽取方法的设计和实现 |
| |
引用本文: | 张小莉,夏冉,姚建民.浅谈基于XML的web页面信息抽取方法的设计和实现[J].科技风,2008(1). |
| |
作者姓名: | 张小莉 夏冉 姚建民 |
| |
作者单位: | 苏州大学计算机科学与技术学院,江苏苏州,215000 |
| |
摘 要: | 通过首先对当前信息抽取技术和现有的XML技术进行分析与研究,发现如何有效地确定抽取规则是当前Web信息抽取的主要难点。针对目前存在的问题,给出了一种基于XML的Web信息抽取的解决方案,并对其中相关的技术进行了深入的探讨和研究。
|
关 键 词: | 信息抽取 XML 抽取规则 |
本文献已被 CNKI 万方数据 等数据库收录! |
|