首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
李中言  李普跃 《现代情报》2007,27(10):96-97
本文论述了信息抽取技术的概念、类型、内容和信息抽取系统设计方法。提出了信息抽取系统模型,以及它在数字图书馆中的应用。  相似文献   

2.
自由文本信息抽取技术   总被引:13,自引:0,他引:13  
李向阳  苗壮 《情报科学》2004,22(7):815-821,829
信息抽取是从自由文本语料库构建数据库,实现情报自动收集的有效途径之一。近十多年来,信息抽取技术逐步走向成熟,已成为与信息检索相平行的技术之一。对信息抽取技术进行系统的归类、总结,已显得较为迫切。在对当前多种主要的信息抽取技术进行分析、比较的基础上,结合信息抽取所面临的挑战,分析了信息抽取的三个趋势。  相似文献   

3.
基于Web的信息抽取技术研究综述   总被引:1,自引:0,他引:1  
蒲筱哥 《现代情报》2007,27(10):215-219
本文在讨论Web信息抽取技术的发展历程、概念及其功能,Web信息抽取技术方法的分类及技术特点分析。Web信息抽取系统的构建研究及其性能评价的基础上。分析了当前研究存在的问题以及未来的研究方向。  相似文献   

4.
一种基于XML的Web信息抽取方法   总被引:4,自引:2,他引:4  
目前Web资源含有大量的有用信息,但由于它们欠结构化,不能为传统的数据库型查询系统所利用。针对这一问题,出现了Web信息抽取技术。在论述了半结构化Web信息抽取技术总体解决方案的基础上,研究了Web信息抽取的实现技术,并从应用的角度提出一种新的半结构化信息获取方法。该方法包括网页分析过程、映射的自动生成和信息抽取过程。在Web信息抽取的实现部分,提出了抽取规则执行算法,为进一步满足Web信息检索提供了一种新的高效的检索方法。  相似文献   

5.
董旻  方曙  杨志萍 《情报杂志》2007,26(6):73-75,78
提出一种利用JTree和XPath技术实现动态网页信息抽取系统的方法,介绍了系统主要组件的功能和实现方法,并进行实际的抽取试验,论述了此设计的优点。  相似文献   

6.
史旗凯  郭菊娥 《情报杂志》2007,26(12):90-92
为了有效利用管理领域所产生的大量信息,在论述信息抽取的特征、技术现状与发展趋势的基础上,提出了管理事件的定义、特征及其信息填充模板的结构化构成,描述和解答了管理事件信息抽取的过程与常见问题,并认为集成了知识工程和自然语言处理技术的管理事件信息抽取系统必将推动信息管理研究的深入发展和实际管理绩效的显著改进。  相似文献   

7.
信息抽取的功能和实现方法   总被引:1,自引:1,他引:0  
信息抽取是近十年来发展起来的一门数据挖掘技术,它主要解决实现从海量的自然语言文本中快速、有效、直接地抽取出指定的信息。分析了信息抽取的主要概念,介绍了信息抽取的主要功能和实现方法,并为完善其功能提出了几个任务  相似文献   

8.
一种基于视觉分块的Web信息抽取方法研究   总被引:1,自引:0,他引:1  
随着浏览器/服务器体系结构和动态网页技术的广泛应用,对网页进行快速、准确地信息抽取的技术研究已成为一个热点.结合动态网页的生成特点和针对已有抽取方法的不足,提出了一种基于视觉分块的Web信息抽取方法.  相似文献   

9.
信息抽取技术在数字图书馆中的应用研究   总被引:5,自引:0,他引:5  
信息抽取研究旨在为人们提供更有力的信息获取工具,以应对信息爆炸带来的严峻挑战。本文分析了信息抽取的概念、类型与方法,提出了信息抽取技术在数字图书馆中的几个应用领域。  相似文献   

10.
彭同坠 《科教文汇》2008,(36):278-278
信息抽取技术的研究旨在为人们提供一种更有利的获取信息的方式,针对互联网上web页面的异构性和动态性,本文提出了一种通用的web新闻页面信息抽取的方法。该方法克服了传统的网页信息抽取中针对不同的网站制作不同的包装器的缺点。本方法主要针对新闻页面正文、发布时间、转载情况的信息抽取,为自然语言处理的研究提供语料支持,其准确性能够很好地满足需求。  相似文献   

11.
信息抽取技术在情报学中的应用分析   总被引:3,自引:1,他引:2  
对海量信息进行有效收集与组织是情报学要解决的关键问题。分析了信息抽取技术的特点及其关键技术,讨论了信息抽取技术在情报学中的应用价值。通过信息抽取技术收集和组织信息,可提高信息相关性并为知识服务奠定基础。  相似文献   

12.
随着Web信息抽取的研究和发展,抽取技术已经逐渐成熟,通过软件来实现从Web页中抽取所需要的信息已成为可能。对基于.NET技术实现的Web信息抽取系统进行了研究,分析并提出了HTML文档下载和清理、HTML到XML格式转换、数据定位及抽取、抽取数据的保存等需要研究解决的关键技术问题,并探讨了相应的解决方案。  相似文献   

13.
刘爽 《现代情报》2006,26(11):75-76
文中论述了信息抽取技术的概念与特点,类型与方法以及在现代数字图书馆中的应用分析。  相似文献   

14.
李春杰  马建玲 《情报科学》2019,37(4):157-164
【目的/意义】图情领域在数字资源发现、组织与应用中越来越多使用到信息抽取技术,本文将对该领域在 信息抽取技术方面的研究进展及应用情况等进行分析,为本领域相关人员提供参考。【方法/过程】以国内图书馆 学、情报学领域中国核心期刊和国外33种图情期刊为信息源对其中刊载的信息抽取相关研究成果进行计量分析, 检索过程不设置时间限制,并利用CNKI、EndNote、Excel、Python分析工具对主题相关的165篇中文文献和35篇外 文文献进行年度趋势分析、期刊发文量分析、机构分析、作者分析以及论文主题分布研究。【结果/结论】得出图情领 域信息抽取研究的发展趋势、重要的信息源、重要作者、主题研究以及信息抽取技术在图情领域的具体应用。  相似文献   

15.
网页信息抽取包装器的生成方法很多,按自动化程度可分为手工、半自动和全自动三类,本文旨在研究全自动生成网页信息抽取包装器的主要技术方法,首先构建了对应的分类体系;其次对近年来主流的15种包装器生成技术进行了定性分析和分类比较;最后提出5点发展趋势。  相似文献   

16.
随着互联网的快速发展,Web信息抽取技术的研究及应用已越来越多,本文介绍了Web信息抽取技术的概念及国内外的发展历程,分析了Web抽取信息的原理;对目前主流的Web信息抽取技术进行了归纳分析,阐述了Web信息抽取的评价指标。  相似文献   

17.
通过首先对当前信息抽取技术和现有的XML技术进行分析与研究,发现如何有效地确定抽取规则是当前Web信息抽取的主要难点。针对目前存在的问题,给出了一种基于XML的Web信息抽取的解决方案,并对其中相关的技术进行了深入的探讨和研究。  相似文献   

18.
【目的/意义】面对海量的信息,人们需要更为高效准确的信息获取方式。数值信息抽取的研究使隐含在无 序信息载体中的大量有价值数值信息可以得以利用,从而满足科研工作者数据驱动型研究的信息需求。【方法/过 程】本文旨在总结和归纳数值信息抽取研究的相关内容,包括数值信息抽取的内涵、数值信息抽取研究概况、面临 的困境和制约因素以及应用等。【结果/结论】数值信息抽取仍然面临着巨大的挑战,且现有的数值信息抽取研究较 少,对于数值信息的抽取,基于规则和统计学习的方法各有利弊,总体来说,基于规则的抽取方法仍是主流方法。  相似文献   

19.
李斌 《大众科技》2010,(4):48-49
文章阐述了web信息抽取的定义、抽取过程、Web信息抽取方法的分类,并指明了web信息抽取的应用领域和发展方向。  相似文献   

20.
Web抽取技术是众多对网络信息资源挖掘中重要的一项技术。近年来,Web抽取技术发展很快,已渗透至各个领域,应用到很多行业,但真正涉及陶瓷产品应用这一块的不多,本文在分析了Web抽取技术现阶段发展现状的基础上,针对陶瓷产品的特点提出了陶瓷产品信息Web抽取的技术路线,以便获得和整理陶瓷产品信息,规范陶瓷产品的信息资源。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号