首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于.NET的Web信息抽取系统关键技术研究
引用本文:谭锋,李天真,崔亮亮.基于.NET的Web信息抽取系统关键技术研究[J].人天科学研究,2010(12):120-122.
作者姓名:谭锋  李天真  崔亮亮
作者单位:[1]湖州职业技术学院机电工程分院,浙江湖州313000 [2]浙江久立集团股份有限公司,浙江湖州313012
基金项目:浙江省教育厅科研项目(Y200803750)
摘    要:随着Web信息抽取的研究和发展,抽取技术已经逐渐成熟,通过软件来实现从Web页中抽取所需要的信息已成为可能。对基于.NET技术实现的Web信息抽取系统进行了研究,分析并提出了HTML文档下载和清理、HTML到XML格式转换、数据定位及抽取、抽取数据的保存等需要研究解决的关键技术问题,并探讨了相应的解决方案。

关 键 词:.NET  Web信息抽取  应用软件  HTML  XML

The Critical Technology Research on Web Information Extraction System Based on .NET
Authors:Tan Feng Li Tianzhen Cui Liangliang
Institution:Tan Feng Li Tianzhen Cui Liangliang
Abstract:With the Web information extraction researchment and development,and in the extraction technology has gradually matured through the software from a Web page to extract the required information is possible.Based on.NET technology for Web information extraction system for research,analysis and put forward the document to download and clean up HTML,HTML to XML format,data location and extraction,extraction of data preservation needs to study and solve key technical problems and to explore the corresponding solutions.
Keywords:,NET,Web Information Extraction,Application Software,HTML,XML
本文献已被 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号