首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于HTML或MXL描述的Web页信息抽取技术研究
引用本文:谢维成,吕先竞,宋玉忠.基于HTML或MXL描述的Web页信息抽取技术研究[J].情报科学,2005,23(9):1398-1402.
作者姓名:谢维成  吕先竞  宋玉忠
作者单位:1. 西华大学,电气信息学院,四川,成都,610039
2. 西华大学,图书馆,四川,成都,610039
基金项目:国家社会科学基金项目(02BTQ013)
摘    要:从同类企业挖掘有价值的信息是企业信息化的重要任务,目前Web企业信息描述大多数是用HTML表示的,但基于XML描述的企业信息Web页面逐渐增加,Web数据抽取是Web企业信息挖掘的关键,本文提出了一种面向HTML和XML描述的Web页面的Web数据抽取模型并阐述了实现过程。

关 键 词:Web  企业信息挖掘  HTML  XML  数据抽取
文章编号:1007-7634(2005)09-1398-05
收稿时间:2005-01-11
修稿时间:2005年1月11日

Study on Information Extraction Technology Based on Web Pages Descrbed with HTML or XML
XIE Wei-cheng,Lü Xian-jing,SONG Yu-zhong.Study on Information Extraction Technology Based on Web Pages Descrbed with HTML or XML[J].Information Science,2005,23(9):1398-1402.
Authors:XIE Wei-cheng  Lü Xian-jing  SONG Yu-zhong
Abstract:Worthy information mining from kindred enterprise is important task of enterprise information system, currently Web enterprise information depiction almost uses HTML, but Web page based XML is increasing. Web data extraction is a key procedure of Web enterprise information Mining, This article proposes a Web data described with HTML or XML extraction model and discusses achieving procedure.
Keywords:web  enterprise information Mining  HTML  XML  data extraction
本文献已被 CNKI 维普 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号