首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于DOM的Web信息自动抽取
引用本文:吴伟,刘友华.基于DOM的Web信息自动抽取[J].现代图书情报技术,2004,20(2):68-71.
作者姓名:吴伟  刘友华
作者单位:南京大学信息管理系,南京,210093
摘    要:提出了Web页面信息的自动抽取思想,并使用WebBrowser和DOM技术实现了Web页面上网页元素查找、表单自动填写、表单自动提交、自动获得查询结果并自动抽取所需信息的技术,从而实现了Web页面信息的自动抽取。文中还给出了这一方法的实现细节和示例代码。

关 键 词:Web页面  自动信息抽取  DOM  WebBrowser
收稿时间:2003-09-15
修稿时间:2003年9月15日

Automatic Web Information Extraction Based on DOM
Wu Wei Liu Youhua.Automatic Web Information Extraction Based on DOM[J].New Technology of Library and Information Service,2004,20(2):68-71.
Authors:Wu Wei Liu Youhua
Institution:(Department of Information Management, Nanjing University,Nanjing 210093,China)
Abstract:More and more Web sites are built on database -driven architecture. The Web pages of these sites are creating dynamically. This paper advances and implements a method of automatic information extraction from the dynamic pages by using WebBrowser and DOM technique. In addition, the paper illustrates the details and code through a prototype.
Keywords:Dynamic Web Automatic information extraction DOM WebBrowser  
本文献已被 CNKI 维普 万方数据 等数据库收录!
点击此处可从《现代图书情报技术》浏览原始摘要信息
点击此处可从《现代图书情报技术》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号