共查询到19条相似文献,搜索用时 734 毫秒
1.
实体关系抽取的技术方法综述* 总被引:3,自引:0,他引:3
对实体关系抽取研究以MUC和ACE评测为主线的发展进行总结,并指出实体关系抽取任务普遍存在的三个问题是特定领域标引数据集的获取、模式的获取以及共指消解。在对当前关系抽取的相关文献、系统和项目进行分析研究的基础上,将基于非结构化文本的实体关系抽取技术方法归纳为:基于模式匹配的关系抽取、基于词典驱动的关系抽取、基于机器学习的关系抽取、基于Ontology的关系抽取以及混合抽取方法,旨在为进一步构建实体关系抽取系统提供良好借鉴。 相似文献
2.
国外Web信息抽取研究综述 总被引:3,自引:0,他引:3
Web信息抽取旨在为人们提供获取网络知识单元的有力工具,以应对信息爆炸带来的严峻挑战。在回顾Web信息抽取基本理论的基础之上,评述了Web信息抽取主要研究内容的现状,并着重对Web信息抽取的评价研究和应用研究进行了介绍,以期有助于本研究继续向前发展。 相似文献
3.
典型关系抽取系统的技术方法解析 总被引:3,自引:0,他引:3
实体关系抽取是信息抽取领域中的一项重要任务.文章在对当前关系抽取的相关文献、系统和项目进行分析研究的基础上,将基于非结构化文本的实体关系抽取技术方法归纳为:以模式构造和匹配为主线进行关系抽取、以词典驱动关系抽取、运用机器学习算法进行关系抽取、借助Ontology进行关系抽取以及多种方法有机结合进行关系抽取.从技术应用特点、核心模块的实现细节以及系统评测结果等方面深入分析了典型的关系抽取系统,它们包括EEES关系抽取系统、SVM关系抽取系统、T-Rex关系抽取系统、KMI语义网络门户的混合关系抽取系统,旨在为进一步构建实体关系抽取系统提供良好借鉴.该文为2008年第9期本期话题"知识抽取"的文章之一. 相似文献
4.
对学术论文中的算法实体进行研究,能够促进深入了解算法对科学研究的作用,而从全文数据中抽取算法实体是相关研究的基础。学术论文全文内容中算法实体的抽取可以看作一种特殊的命名实体识别。本文通过人工识别的方法,从4641篇论文中抽取出977种算法实体并构建算法实体词列表,以此为基础构建标注语料,训练算法实体自动抽取模型,在剩余语料上抽取得到221种新算法实体,并将自动抽取结果与人工抽取结果进行整合得到全部算法实体1198种。研究结果表明:人工抽取法的结果能够为自动抽取法构建一定数量的标注语料,所构建的算法实体自动抽取模型能够有效地抽取出人工方法中遗漏的新算法实体,同时还能够抽取出已有算法实体的全新表达形式,进一步对人工抽取结果进行扩充和完善。 相似文献
5.
6.
7.
王非 《现代图书情报技术》2006,1(9):53-57
针对目前大量研究机构和个人在网络上共享并定期更新其研究论文的情况,研究收集、跟踪这些学术文献信息使其成为图书馆网络数字资源有益补充的可能性,指出网络学术文献信息发布存在一定规律,并据此提出了一种能从互联网自动识别、抽取、组织这类学术信息并提供查询的门户架构。 相似文献
8.
信息抽取技术及其在数字图书馆中的应用前景分析 总被引:18,自引:1,他引:18
张智雄 《现代图书情报技术》2004,20(6):1-5
信息抽取的目标是自动从文本信息中抽取出预先想要得到的信息(知识) , 它提供了一条从浩瀚的信息堆积中抽取出与用户相关的信息的一条思路。文章分析了信息抽取的主要概念、主要研究活动、信息抽取的类型和信息抽取系统的一般结构, 并提出在数字图书馆的建设中, 信息抽取技术能够在数字内容的自动标引、元数据获取、数据挖掘、情报研究分析、大型知识库数值库建设、参考咨询等方面发挥重要的作用。 相似文献
9.
基于本体的Web信息抽取就是以所构建的本体为核心,利用本体中已定义的概念、分类层次、关系、函数、公理和实例及一些必需的外部资料对Web页面进行信息提取,得到结构化的知识并保存的过程,这一技术已经成为国内外研究的热点之一。文章介绍了信息抽取的历史,给出了基于本体的Web信息抽取一般体系结构模型及相关实现,系统地分析比较了各种基于本体的Web信息抽取方法,指出了目前这些方法实现的关键、得到的结果及其不足之处,展望了Web信息抽取发展的方向。 相似文献
10.
网络舆情搜索引擎与通常的网络信息搜索不同,其最终结果要深入到站点和页面内部采集与抽取有效数据,给情报界提出了许多新的研究内容和方法.在对网页信息抽取的模板和页面分析两种方式、基于自然语言处理、包装器归纳和Ontology抽取方法的分析基础上,使用基于包装器归纳方式并在规则生成模块中采用专家模式,设计一种基于样本学习的新闻抽取方法,通过人工分析网页源代码制定和修改抽取规则,然后根据抽取规则进行信息自动抽取,以提高舆情搜索引擎的精度和质量. 相似文献
11.
信息抽取系统的研究现状 总被引:16,自引:0,他引:16
对信息抽取的概念和发展状况做了论述,介绍了国内外信息抽取系统发展状况,指出了存在的问题以及相应的解决方案,最后对中文信息抽取系统的建设提出了几点建议。 相似文献
12.
论文利用EXCEL和SPSS作为分析工具,采用文献计量和因子分析方法,分析了我国2001-2010年信息伦理学研究现状及热点,得出我国信息伦理学的研究趋势和重点主要集中于信息伦理规范、网络环境下的信息伦理学研究、图书馆与信息伦理、特殊人群的信息伦理教育、信息伦理道德教育与技术教育研究五个方面,旨在为信息伦理学的发展提供借鉴。 相似文献
13.
选取图书馆学、情报学领域各4种核心期刊,构建近30年的关键词共现网络,引入学科隶属度和G-N聚类算法,对图书馆学、情报学领域的知识地图进行共时和历时分析。研究发现:该领域的关键词共现网络符合复杂网络的基本特征。共时分析发现:可将该领域划分为10个板块;属于情报学的5个(信息组织、信息检索、文献计量学、用户研究与服务、网络技术);属于图书馆学的4个(信息资源建设、文献学、资源共建共享、图书馆事业);两学科关注度相当的1个(开放存取)。历时分析发现:1990年以前图书馆学研究的体系性更强;1990-2000年,情报学的发展态势强于图书馆学;2000年后图书馆学则强于情报学。 相似文献
14.
开放存取基于开放与共享的理念,依托网络技术,正在成为学术出版和科学信息交流的全新模式。简要介绍了开放存取的基本内容,分析了开放存取对图书馆信息资源建设的影响,探讨了开放存取环境下高校图书馆信息资源建设的对策。 相似文献
15.
智能化农业信息系统的设计与应用 总被引:7,自引:0,他引:7
信息系统的智能化是网络建设的重要发展趋势。本文从推进农业信息化的角度出发 ,论述了湖南智能化农业信息系统的网络体系、联网方式、功能定位、资源开发与以专家系统为代表的咨询服务系统建设等有关问题 ,重点分析了网络环境下的农业专家系统的基本结构、开发平台、应用框架等设计技术和推广应用等工作。文章对智能化信息技术在农业领域的应用和网络系统从一般信息服务走向知识服务的探索具有现实意义 相似文献
16.
网络学术资源组织——高校图书馆建设重点学科导航系统的思考 总被引:1,自引:0,他引:1
景海燕 《大学图书情报学刊》2009,27(5):38-40
随着现代信息技术的迅猛发展以及网络的普遍应用,网络信息资源迅速增长且成为现代图书馆资源的重要组成部分。为解决网络信息资源的动态性强且极度分散与用户的信息需求相对集中的矛盾,建立重点学科导航系统成为各高校图书馆的普遍性选择。文章从建立重点学科导航系统的必要性、基础性工作以及应注意的问题几方面,作了初步的探讨。 相似文献
17.
公共图书馆信息网络安全管理策略 总被引:7,自引:0,他引:7
随着计算机及网络技术广泛应用于图书馆,使得图书馆信息网络安全问题成了不容回避的重要课题。本文结合湖南图书馆信息网络安全建设的实践,从防火墙、交换机、入侵检测、病毒防范、安全管理等角度分析了保证信息网络安全所应采取的技术和管理策略。 相似文献
18.
信息资源数字化建设与应用技术 总被引:13,自引:0,他引:13
黄波 《现代图书情报技术》2003,19(2):61-64
将信息资源数字化建设与应用技术作为一门学科进行了较全面的阐述。指出信息化离不开数字化,Digital Library不只是数字化图书馆这个狭义的范畴,可广义理解为数字化信息资源库群。积极进行信息资源数字化建设与应用集成系统研发,并在全社会各行各业信息化建设中应用,积累经验和形成规范与标准,形成分布在政府机构网站、企业ERP系统、研究机构、高校文献信息中心和电子商务网站等数字化信息资源库群,是切实可行的国家信息高速公路基础设施建设之路。 相似文献
19.
中外专利信息网络检索工具的比较研究 总被引:4,自引:0,他引:4
从收录范围、检索方式、检索功能、检索结果等方面,对中华人民共和国知识产权局网站专利数据库、中国知识产权网专利数据库、中国专利信息网专利数据库、世界知识产权组织专利数据库、IBM知识产权网专利数据库等国内外9种常用的网络专利数据库进行比较,并就如何有效地利用这些网络专利信息资源提出建议。 相似文献