首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 296 毫秒
1.
信息抽取的目标是自动从文本信息中抽取出预先想要得到的信息(知识),它提供了一条从浩瀚信息堆积中抽取出与用户相关信息的一条思路。本文分析了信息抽取的主要概念、信息抽取的现状及类型,提出了在数字图书馆的建设中,信息抽取技术在数字内容的自动标引、数据获取、数据挖掘、情报研究分析、参考咨询等方面发挥重要的作用。  相似文献   

2.
信息抽取的目标是自动从文本信息中抽取出预先想要得到的信息(知识),它提供了一条从浩瀚信息堆积中抽取出与用户相关信息的一条思路.本文分析了信息抽取的主要概念、信息抽取的现状及类型,提出了在数字图书馆的建设中,信息抽取技术在数字内容的自动标引、数据获取、数据挖掘、情报研究分析、参考咨询等方面发挥重要的作用.  相似文献   

3.
一、信息抽取的概念 信息抽取是自然语言处理研 究中一个正在走向成熟的研究领 域。信息抽取的目标是自动实现从 文本信息中抽取出预先想要的信 息(知识),它提供了一条从浩瀚的  相似文献   

4.
基于领域本体的信息抽取模式生成与系统实现   总被引:1,自引:0,他引:1  
马静  吴一占  刘思峰 《情报学报》2008,27(2):193-198
面对情报工作者日益增长的从Internet中及时获取特定信息或知识的需求,本文展开了web信息抽取技术在情报领域的应用研究.目前,信息抽取模式的自动获取成为一个技术难点,本文尝试引入基于领域本体的半自动抽取模式获取算法,该方法在领域本体的概念层次关系、属性特征和实例的结构本体指导下,选择其主要特征属性为匹配目标,自动学习并获取抽取模式.利用该算法到直升机产品信息抽取,运行结果验证:该算法简单有效,获得了较高的抽取效率和较准确的抽取结果.  相似文献   

5.
模板处理的含义及其主要内容。详细阐述了模板处理在数字化文献环境中的主要应用领域:利用模板建立引用数据库,从电子刊物中抽取信息等。并探讨了在元数据中利用模板自动抽取信息的一些原理及方法。  相似文献   

6.
网络招聘文本技能信息自动抽取研究   总被引:1,自引:1,他引:0  
[目的/意义]针对目前网络招聘文本手工抽取技能信息无法满足大数据量分析要求的问题,提出一种针对大量网络招聘文本的技能信息自动抽取方法。[方法/过程]根据网络招聘文本的特点,利用依存句法分析选取候选技能,然后提出领域相关性指标衡量候选技能,将其融入传统的术语抽取方法之中,形成一种网络招聘文本技能信息自动抽取方法。[结果/结论]实验表明,本文提出的方法能够从网络招聘文本中自动、快速、准确地抽取技能信息。  相似文献   

7.
模板处理在数字化文献中的应用   总被引:1,自引:0,他引:1  
王宁 《云南图书馆》2001,(1):43-45,49
介绍了数字图书馆和模板处理的含义及其主要内容,详细阐述了模板处理在数字化文献环境中的主要应用领域,即利用模板建立引用数据库,从电子刊物中抽取信息等,并探讨了在元数据中利用模板自动抽取信息的一些原理及方法。  相似文献   

8.
本文把信息抽取结合进数字图书馆的三层架构体系,从数据挖掘、情报搜索以及专家系统三个方法上出发,结合模板数据挖掘平台,情报自动搜集平台和图书馆大型知识库、数值库设计出了一套信息抽取在数字图书馆里应用的实例。同时,该模型整合进了数字图书馆中的数据库平台、情报咨询平台等服务平台。  相似文献   

9.
网络科技信息具有开源、发布及时等特点,目前已成为战略情报监测的重要资源。但这类资源又具有非结构化、无语义描述等特点,如何将Web信息从非结构的自由信息转为可分析的结构化、语义化信息成为一个亟需解决的问题。针对这一问题,笔者提出了网络科技信息结构化监测的思路方法。这一方法通过知识抽取技术,从网络信息资源中抽取出嵌在其中的知识对象以及对象间的相互关系,将自由文本转换为结构化的可计算的知识单元,在此基础上构建各类监测模型,进而实现对研究领域的态势监测。基于这一思路,笔者开发了“网络科技信息自动监测系统”,并基于监测数据所形成的语义资源,进行了监测态势分析实验。图 6。表1。参考文献16。  相似文献   

10.
提出了Web页面信息的自动抽取思想,并使用WebBrowser和DOM技术实现了Web页面上网页元素查找、表单自动填写、表单自动提交、自动获得查询结果并自动抽取所需信息的技术,从而实现了Web页面信息的自动抽取。文中还给出了这一方法的实现细节和示例代码。  相似文献   

11.
数字信息资源的自动分类和主题识别--OCLC"蝎子计划"研究   总被引:2,自引:0,他引:2  
“蝎子计划(Scorpion Project)”是美国 OCLC 利用《杜威十进分类法》电子编辑支持系统(ESS)对数字信息资源进行自动分类和主题识别的一个研究项目。本文简要介绍了该项目的进展情况、实施原理,描述了 Scorpion 对数字信息资源进行自动分类和主题识别的具体流程,并将其与我们自行研发的基于《中图法》知识库的中文信息自动标引和自动分类系统进行对比分析,以探讨 Scorpion 对中文信息自动分类和主题识别的借鉴意义。  相似文献   

12.
近五年来自动标引研究在关键词抽取、标引系统设计、自动分类标引、网络信息自动标引、数字图像标引、音频信息标引、视频信息标引、自动标引结果评价等方面取得很大进展,但尚存弱点与不足之处,还不能达到人工标引的效果。今后的研究将朝着探索更优越的语言分析技术、更高端的多媒体信息自动标引方法、高效的知识库智能自学习机制、多种标引方法或模型的互补的集成学习等方向发展。  相似文献   

13.
数据挖掘技术在图书馆工作中的应用   总被引:17,自引:0,他引:17  
数据挖掘是一门新兴的数据分析技术。本介绍数据挖掘在数字图书馆中实现的流程和方法,并对其在图书馆的应用作出科学分析。使现代图书馆服务领域得以扩宽,从传统查询服务扩展到基于WEB信息空间或自动化管理系统的知识服务。  相似文献   

14.
国家图书馆数字图书馆概论   总被引:1,自引:0,他引:1  
介绍国家图书馆数字图书馆系统由数字资源采集与制作、数字资源的永久保存与存储管理、数字资源发布与服务、灾害备份等子系统组成。构造现代图书馆的信息网络化服务平台需要,全面整合图书馆的服务和自动化系统。作为目前中国最大的数字图书馆系统总体设计之一,国家数字图书馆工程的设计尚存在很多问题需要在实施过程中逐步解决。  相似文献   

15.
随着计算机技术的发展与数字资源建设的不断跟进,大量的纸质文献需要进行数字转化为电子文献,电子文献逐渐成为信息资源的重要组成部分。电子文献的普及和广泛应用,使得针对电子文献的自动校对系统的研究应运而生。文章在调研了国内外相关的文本自动校对相关研究之后,结合CSSCI数据库的实际情况,构建了一个基于混淆集和上下文特征分析的文本自动校对系统模型,并进行了其相关的实验。  相似文献   

16.
自动文摘的四种主要方法   总被引:17,自引:0,他引:17  
本文将现有的自动文摘方法概括为四种:自动摘录、基于理解的自动文摘、信息抽取和基于结构的自动文摘,并详细介绍了这四种方法的基本原理,剖析了它们的优点和不足。最后,概述了中文自动文摘的研究状况。  相似文献   

17.
本文提出基于MPEG 7的教学语音内容的描述模式 ,它是语音数据的层次结构化组织和多维索引的重要依据。描述模式为用户提供了层次结构的浏览视图和导航机制 ,以及反映用户多角度观察和分析的多维索引 ,从而实现互操作性的基于内容的语音检索等服务。最后本文概要地分析了特征的自动提取和描述的自动生成技术。  相似文献   

18.
面向数字图书馆的本体自动构建   总被引:1,自引:0,他引:1  
提出一种面向数字图书馆的本体自动构建方法:首先从因特网数据中找出本体语义概念的模式及其关系,然后通过构建概念分类体系来自动化地抽取数字图书馆的各类本体。包括以下步骤:术语选择、抽取本体概念、语义关系抽取、分类体系构建、本体构建和本体修剪及评价。图3。参考文献3。  相似文献   

19.
基于语义模型的数字图书馆知识组织信息抽取策略   总被引:1,自引:1,他引:0  
简述语义模型是实现数字资源语义关系形式化描述的方式,是数字图书馆知识组织语义互联的重要影响因素。作为数字图书馆知识组织语义互联的重要环节,信息抽取需要本体提供语义知识依据,同时产生的文档也可以作为设计和丰富本体的知识资源。构建数字图书馆知识组织语义互联的语义模型以“元数据、领域本体、桥本体、本体解析体系”为核心要素,在此基础上探讨信息抽取的策略。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号