基于.NET的Web信息抽取系统关键技术研究 The Critical Technology Research on Web Information Extraction System Based on .NET期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

基于.NET的Web信息抽取系统关键技术研究

引用本文：	谭锋,李天真,崔亮亮.基于.NET的Web信息抽取系统关键技术研究[J].人天科学研究,2010(12):120-122.

作者姓名：	谭锋李天真崔亮亮

作者单位：	[1]湖州职业技术学院机电工程分院,浙江湖州313000 [2]浙江久立集团股份有限公司,浙江湖州313012

基金项目：	浙江省教育厅科研项目（Y200803750）

摘要：	随着Web信息抽取的研究和发展,抽取技术已经逐渐成熟,通过软件来实现从Web页中抽取所需要的信息已成为可能。对基于.NET技术实现的Web信息抽取系统进行了研究,分析并提出了HTML文档下载和清理、HTML到XML格式转换、数据定位及抽取、抽取数据的保存等需要研究解决的关键技术问题,并探讨了相应的解决方案。
关键词：	.NET Web信息抽取应用软件 HTML XML
The Critical Technology Research on Web Information Extraction System Based on .NET

Authors:	Tan Feng Li Tianzhen Cui Liangliang

Institution:	Tan Feng Li Tianzhen Cui Liangliang

Abstract:	With the Web information extraction researchment and development,and in the extraction technology has gradually matured through the software from a Web page to extract the required information is possible.Based on.NET technology for Web information extraction system for research,analysis and put forward the document to download and clean up HTML,HTML to XML format,data location and extraction,extraction of data preservation needs to study and solve key technical problems and to explore the corresponding solutions.

Keywords:	,NET,Web Information Extraction,Application Software,HTML,XML
本文献已被维普等数据库收录！

设为首页 | 免责声明 | 关于勤云 | 加入收藏