共查询到20条相似文献,搜索用时 78 毫秒
1.
基于统计自然语言处理技术的领域本体半自动构建研究 总被引:1,自引:0,他引:1
本体的构建是影响语义Web成功与否的重要因素之一.本文借鉴机器学习以及自然语言处理等技术成果尝试半自动构建本体,以专业研究论文为研究语料,采用N-Gram文本表达法从语料中抽取关键概念,计算主题度获取领域概念.利用改进的层次聚类算法对领域概念进行聚类以获取其等级体系,采用句法分析与统计相结合的方法从语料中获取可能的主、谓、宾模式为领域关系提供参考,并以农业史为例,设计开发了一个领域本体半自动构建实验系统,文中重点介绍了本体构建中概念的获取、等级关系、领域关系的构建以及形式化处理等关键技术的实现过程. 相似文献
2.
为充分发挥知识组织在企业专利战略中的作用,在分析专利文献的基础上,根据中文专利文献句法描述的特点,利用最大串频匹配、蚁群聚类、多层KMeans聚类、改进关联规则计算、基于规则和CRFs的术语关系抽取等算法,设计出一套领域本体的半自动构建系统,包括术语抽取、分类关系抽取、非分类关系抽取、本体形式化等模块,初步实现结构化数据和非结构化文本的本体半自动构建。 相似文献
3.
WordNet与SUMO本体之间的映射机制研究 总被引:1,自引:0,他引:1
针对本体概念与自然语言词汇之间存在普遍性与特殊性的矛盾,以WordNet同义词典和SUMO本体为研究对象,对两者进行简要概述,详细分析两者之间的映射动机,提出自然语言词汇、WordNet同义集和SUMO本体概念之间的映射模型,并深入分析WordNet同义集与SUMO本体概念之间的映射实例、映射效果及应用。希望藉此更好地利用WordNet同义词典与SUMO本体概念之间的映射关系去解决本体概念与自然语言词汇之间的矛盾,促进本体更广泛地应用于智能检索、语义分类、数据挖掘等领域。 相似文献
4.
专利情报监测和获取对专利情报分析非常重要.本文通过调研当前市场上一些专利情报系统,针对这些系统存在的缺点和不足,提出一个能够从网络上实时动态进行专利监测和获取的专利情报系统.系统采用自然语言的问句查询方式,实现不同语言形式和不同语言格式的检索,并通过在线翻译技术和本体WordNet等技术进行扩展查询,实现了一定的语义搜索功能,能对专利情报进行基于语义分析的监测和获取.文章首先介绍了自然语言查询的实现方法;然后,对专利搜索引擎的功能实现作了详细的说明;最后,通过实验对系统实现的效果进行了详细测试和分析,并验证了该系统设计方法的可靠性和可行性. 相似文献
5.
一个构造良好的查询是信息检索质量的基本保证,语义查询扩展技术解决了传统信息检索系统不能很好理解用户查询意图的问题,在提高检索查全率的同时保证了检索准确率。本文以查询关键字之间的语义关联为切入点,辅以隐式反馈技术获取消歧上下文,以WordNet本体库和WordNet Domains扩展库作为消歧数据源,使用基于局部上下文和基于图论的两类无导词义消歧方法进行查询关键字到本体概念的映射,最后基于概念词汇关联完成基于语义的查询扩展。综合WordNet本体库和WordNet Domains扩展库中的各项知识源对查询词义进行判定,保证了词义消歧的精度;采用无导词义消歧实现查询词义的快速判定,保证了信息检索的实时性;根据查询关键词的多寡分别提出两类消歧方法,满足了各种查询需求。 相似文献
6.
航空领域本体构建研究 总被引:3,自引:1,他引:2
本文对领域本体构建方法选择原则进行了研究,在提出领域本体构建方法设计与选择原则的基础上,根据航空本体的特点,提出了基于<中国航空百科词典>的航空领域本体构建方法.该方法通过尽可能复用现有术语,重视框架设计与概念间关系规划环节,将概念间关系确定尽可能通过计算机自动完成,人工工作量少,领域专家参与少.通过本方法试验,初步构建出了航空领域本体,在较短的时间内构建出了航空本体.论文针对进化在本体构建中的重要性,在构建方法中重点论述了航空领域本体进化方法,按流程对本体进化中的新词获取、概念及关系确定、版本标识、进化周期等工作环节进行了系统研究. 相似文献
7.
针对大众标注系统中信息检索缺乏语义性的问题,引入本体,建立了基于系统专用本体的语义检索模型,包括7个功能模块:资源标注模块、标签推荐模块、提问处理模块、语义检索模块、结果处理模块、用户反馈处理模块以及本体构建和管理模块,阐述了各个模块的功能.详细分析了以查询扩展为基础的检索策略和过程.重点研究了系统专用本体的构建,提出一种通过分析标签间隐含的语义关系及WordNet辅助生成本体的方法,并进行了模拟实验验证. 相似文献
8.
9.
基于本体的语义检索是提高信息系统检索精确度的有效途径之一.概念云是云模型在信息领域的应用,是本体中的概念按照一定算法在页面中的排列聚合.基于本体与概念云来构建信息检索系统,其设计方案是采用自上而下与自下而上的两种方式相结合构造全局本体、局部上层本体、局部下层本体;再使用Web2.0环境下的内容管理工具进行本体中概念的管理与组织,从而形成概念云;最后以本体与概念云来完善信息检索系统,既提高检准率,又满足用户对知识获取的需求,并可为其他本体系统构建者提供对概念的获取与重用用户知识的功能.本文还描述了本系统语义检索功能实现的原理,阐述了该系统基本实现步骤和关键细节,并展示了该系统的部分功能. 相似文献
10.
11.
基于XML的MARC研究 总被引:4,自引:1,他引:3
本文分析了机读目录MARC在未来数字化图书馆应用的局限性,并提出了改进方案,以哈尔滨工业大学为例,对其采用的中文机读目录CNMARC格式进行了XML转换的尝试,从而使得MARC书目数据库和Internet上的非书目数据库的集成成为可能.本文的研究对于现有MARC数据在未来数字图书馆中的利用具有重要意义. 相似文献
12.
13.
本文从传播学和社会学的视角,以定性与定量研究相结合的方法,分别从网名、聊天形式、聊天对象、聊天内容、聊天语言等方面对青少年使用QQ的情况进行了分析。 相似文献
14.
15.
丁一 《现代图书情报技术》2005,21(6):26-29
Web 信息检索(Information Retrieval)技术研究是应用文本检索研究的成果,它结合Web图论的思想,研究Web上的信息检索,是行之有效的Web知识发现的途径。传统HITS方法所获得的信息精确度相当低,而PageRank作为一通用的搜索方法,不能够应用于特定主题的信息获取。在充分分析了PageRank、HITS等现有算法和Web文档的相似度计算方法的基础上,提出了Web上查询特定主题相关信息发现的RG-HITS算法。它结合了Web超链接、网页知识表示的信息相关度以及HITS方法来搜索Web上特定主题的相关知识。 相似文献
16.
一、方法和步骤 档案工作为农业农村建设服务,离不开规范的基础管理.为了全面了解和掌握我区农业农村档案工作状况,1996年我们对全区农业农村档案现状进行了调查了解,全区28个乡镇、463个村、500多个重点乡村企业、40多个农业科技事业单位,其档案工作几乎等于零.针对这种现状,我们把基础建设放在首位.主要采取以下方法: 相似文献
17.
基于SOA的数字图书馆研究 总被引:2,自引:0,他引:2
SOA基于组件模型结构,采用中立接口进行程序单元之间的交互,可以构建通用的应用系统,基于SOA的数字图书馆本质上是将数字图书馆当做一个提供一系列图书馆信息服务的系统,通过各种服务组合能够实现图书馆业务流程的自动化,以灵活应对图书馆业务需求的变化,通过将孤立不兼容的图书馆信息系统和异构的信息资源以组件的方式封装成标准的服务,并经SOA总线进行服务集成,就可以以服务的方式加以利用,从而最大程度地实现信息资源的整合. 相似文献
18.
基于Ontology的文档过滤研究 总被引:2,自引:0,他引:2
区分文档过滤、信息过滤和文本过滤并介绍文档过滤技术的研究现状;提出基于Ontology的文档过滤的设想,认为其优势在于灵活、共享性好、有利于进行个性化服务等;讨论基于Ontology的文档过滤的实施过程,包括构建准备、本体构建、本体调用,重点阐述公共本体、用户本体和文档本体的构建方法以及实施过程中涉及的技术体系;最后指出今后的努力方向。 相似文献
19.
毛健吾提出《大刚报》所持立场的评价是大骂小帮忙,有借《大公报》的声誉来抬高《大刚报》的社会影响力之嫌。检视《大刚报》1946年初和1949年初两个历史节点的实际表现,《大刚报》虽对国共两党都有骂,主观目的还是通过舆论引导帮国民党的忙。大骂小帮忙本质上与小骂大帮忙没有区别。考量其办报思想,《大刚报》秉持以站在人民立场作为评断骂和帮忙的标准,而赶超《大公报》的实际步骤则客观上帮助共产党进步势力逐步进入《大刚报》。 相似文献
20.
国外图书馆知识管理研究概述 总被引:1,自引:0,他引:1
郭家义 《图书馆理论与实践》2005,(2):95-97
知识管理在图书馆的研究已经进入一个发展期,为此需要对国内外相关研究进行全面与深入地调查和研究 相似文献