基于HTML或MXL描述的Web页信息抽取技术研究 Study on Information Extraction Technology Based on Web Pages Descrbed with HTML or XML期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

基于HTML或MXL描述的Web页信息抽取技术研究

引用本文：	谢维成,吕先竞,宋玉忠.基于HTML或MXL描述的Web页信息抽取技术研究[J].情报科学,2005,23(9):1398-1402.

作者姓名：	谢维成吕先竞宋玉忠

作者单位：	1. 西华大学,电气信息学院,四川,成都,610039 2. 西华大学,图书馆,四川,成都,610039

基金项目：	国家社会科学基金项目(02BTQ013)

摘要：	从同类企业挖掘有价值的信息是企业信息化的重要任务,目前Web企业信息描述大多数是用HTML表示的,但基于XML描述的企业信息Web页面逐渐增加,Web数据抽取是Web企业信息挖掘的关键,本文提出了一种面向HTML和XML描述的Web页面的Web数据抽取模型并阐述了实现过程。
关键词：	Web 企业信息挖掘 HTML XML 数据抽取
文章编号：	1007-7634（2005）09-1398-05
收稿时间：	2005-01-11
修稿时间：	2005年1月11日
Study on Information Extraction Technology Based on Web Pages Descrbed with HTML or XML

XIE Wei-cheng,Lü Xian-jing,SONG Yu-zhong.Study on Information Extraction Technology Based on Web Pages Descrbed with HTML or XML[J].Information Science,2005,23(9):1398-1402.

Authors:	XIE Wei-cheng Lü Xian-jing SONG Yu-zhong

Abstract:	Worthy information mining from kindred enterprise is important task of enterprise information system, currently Web enterprise information depiction almost uses HTML, but Web page based XML is increasing. Web data extraction is a key procedure of Web enterprise information Mining, This article proposes a Web data described with HTML or XML extraction model and discusses achieving procedure.

Keywords:	web enterprise information Mining HTML XML data extraction
本文献已被 CNKI 维普万方数据等数据库收录！

设为首页 | 免责声明 | 关于勤云 | 加入收藏