首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 281 毫秒
1.
为充分发挥知识组织在企业专利战略中的作用,在分析专利文献的基础上,根据中文专利文献句法描述的特点,利用最大串频匹配、蚁群聚类、多层KMeans聚类、改进关联规则计算、基于规则和CRFs的术语关系抽取等算法,设计出一套领域本体的半自动构建系统,包括术语抽取、分类关系抽取、非分类关系抽取、本体形式化等模块,初步实现结构化数据和非结构化文本的本体半自动构建。  相似文献   

2.
专利摘要中含有重要的内容,文章通过对"新能源汽车"中文专利摘要的阅读和分析,提出了一种专利摘要内容判别原则.并通过对国外开源抽取工具GATE和中科院分词工具ICTCLAS的学习和改进,实现了对中文专利摘要的批量抽取,为专利知识库的自动构建准备了充分的语料基础.该文为<数字图书馆论坛>2008年第11期本期话题"科技创新中的专利应用研究"的文章之一.  相似文献   

3.
[目的/意义] 在进行大规模知识库构建时,基于手工方式的构建模式效率较低并且可行性较差,因此,从网络百科中自动地获取海量知识已经被越来越多的学者所关注。目前的研究主要关注于从英文网络百科数据源进行海量知识的抽取,而面向中文百科数据源进行的知识抽取研究工作尚处于起步阶段。[方法/过程] 为解决中文大规模知识库的构建问题,提出一种新的基于中文网络百科架构的大规模知识库的自动化构建方法:在第一阶段,对知识三元组中的主语和宾语之间的语义关系进行自扩展学习;在第二阶段,基于条件随机场和支持向量机协同分类器,对标注出的属性和属性值实体之间的语义关系进行预测。[结果/结论] 实验评测结果表明,该方法较前人工作在典型中文百科分类页面中的实体识别查准率和查全率分别最高有约10%和6%的提升。  相似文献   

4.
基于100万字的973汉语树库,按照语法功能分布的理论,从汉语自动句法分析和语言知识库构建的角度,构建一个相对系统化和多层次的语法知识库。该语法知识库由汉语词语、短语实例、短语结构、句法规则等知识组成。汉语词语知识共统计51 390个汉语词汇的58种语法知识,短语实例知识共获取3 836个汉语短语实例的58种语法知识,短语结构知识共抽取26种短语结构的58种知识,句法规则共有900条记录知识组成。该语法知识库的构建不仅为汉语自动句法分析和语言学研究提供语法知识,而且为更大规模的语法知识库构建打下基础。  相似文献   

5.
随着计算机的普及与快速发展,如何通过在批量数据中提取有效规则实现机器智能分类与推理,提高知识推理的有效性与准确率,成为当前知识服务领域的难题之一.文章基于本体(Ontology)的知识组织方式和粗糙集(Rough Set)理论的知识获取技术,针对批量数据的规则提取实现知识推理,提出知识推理模型ORSKM.ORSKM模型利用九元组构建领域本体,实现实例数据的语义化描述;从领域本体的属性中提取粗糙集的决策表,由决策表对领域本体关系进行领域知识知识库归约,获取领域知识相关的属性规则;通过粗糙集知识推理算法实现知识获取,最后通过实验对该知识推理模型进行验证.  相似文献   

6.
专利本体满足用户对专利信息系统检索的语义需求,但是目前缺乏有效的构建方法,基于WordNet关系数据库的本体构建方法可以根据领域概念直接从关系数据库中获得实体的关系,并扩展原有的领域概念,实现专利领域本体的半自动构建.本文提出了一种基于WordNet关系数据库的本体半自动构建方法,其核心思想是以WordNet关系数据库为主要知识来源,来生成可被本体工具编辑的OWL格式文件,包括两个部分:专利本体数据库半自动构建系统和基于关系数据库本体生成器,本文分析了专利本体数据库半自动构建系统模型,以及专利本体生成与转换流程,并结合实例进行专利本体的构建和应用.  相似文献   

7.
文章明晰技术功效间的多种语义联系,设计技术实现路径的自动化构建方法,实现其即时更新和可视化。结合专利数据特点,基于规则从专利标题中抽取技术词,利用BiLSTM-CRF深度学习模型从专利摘要中抽取专利功效短语,并设计规则从功效短语中自动识别出功效词以及表示技术功效间语义联系的关系词,构建“技术词-关系词-功效词”结构的技术功效语义关联,通过计算实体间语义相似度实现技术词对齐和功效词对齐,优化技术功效关联,依此构建技术实现路径,并以知识网络的形式对其进行可视化。在5G技术领域的实证结果表明,该方法能有效揭示技术功效间的多种语义联系和自动构建技术实现路径,并实现路径的即时更新和清晰展示。  相似文献   

8.
[目的/意义]针对中文专利候选术语选取方法存在需要对不同的数据集分别制定不同的模式匹配规则、专利术语抽取准确性不高等问题,本文提出基于依存句法分析的中文专利术语选取方法,以提高中文专利术语抽取准确性。[方法/过程]主要包括依存句法分析、剪枝、生成依存子树等三个主要步骤。首先对中文专利进行依存句法分析,得到依存树,对依存树进行剪枝,去除不符合要求的依存关系,生成依存子树,从中选取连续词串作为候选术语,以抽取中文专利术语。[结果/结论]实验结果表明,与已有的中文专利候选术语选取方法相比,本文提出的基于依存句法分析的中文候选术语选取方法能够有效地提高中文专利术语抽取的准确性。  相似文献   

9.
专利术语抽取是专利文献信息抽取领域的一项重要任务,有助于专利领域词表的构建,有利于中文分词、句法分析、语法分析等工作的进行。文章通过分析专利术语的特点并制定相应的语料标注规则进行人工标注,采用条件随机场(conditional random fields,CRFs)对标注后的数据进行训练和测试,实现了通信领域的术语抽取。标注方法采用基于字的序列标注,精确率、召回率和F值分别达到80.9%、75.6%、78.2%,优于将词和词性等信息作为特征的方法,表明所提出的专利术语抽取方法是有效的。  相似文献   

10.
[目的/意义] 情境建模是解决信息泛滥、信息过载、实现信息按需服务的重要手段,目前已有的知识库构建和知识融合方法普遍忽略了情境信息,阻碍了知识库的实际应用,降低了知识服务的效率和效果。[方法/过程] 综合考虑环境情境、个人情境和领域本体三个方面,提出一种情境本体驱动的多源知识融合框架,并以此框架融合生成基于情境的药物不良反应知识库ConADR Ontology。在本框架的指导下,以药物不良反应的知识库构建为例,半自动实现情境本体模式层的构建和数据层的扩充;并以情境本体作为中介本体,实现情境本体,药物不良反应领域本体ADReCS和人类疾病领域本体Disease Ontology间的融合;最终在此基础上实现基于SPARQL的案例查询。[结果/结论] 实例验证表明,本框架具有一定的可行性,对知识库的建设和应用具有理论性指导和参考价值。  相似文献   

11.
以基于本体的张謇研究知识库智能检索系统开发为例,探讨基于本体的专题领域知识库智能检索系统的框架结构,工作流程以及功能实现。系统采用语义Web技术和智能Agent技术,使用RDF模型对知识库的Web页面元数据进行描述,然后利用本体建模语言对张謇研究领域知识进行建模,根据所得到的本体对元数据进行基于语义的查询,为用户提供智能检索服务。  相似文献   

12.
阐述利用本体模型(Ontology)实现异构信息系统实现知识协作的想法,提出面向网络信息互操作的松耦合的知识协作模式OKCM,介绍该知识协作模式的系统结构。分析本体模型的知识表示,并结合典型的商务协作流程阐述基于OKCM的知识协作的实现和维护。  相似文献   

13.
提出一种基于本体的开放知识导航构建模型(Onto_OKN)以解决当前知识导航在构建过程中存在的问题,并分析实现该模型的关键:组件导航新建组件、知识评价组件、导航管理组件。该模型为兴趣用户协作构建知识导航和跨学科知识表示提供了途径,在一定程度上减轻了知识工作者及少数权威领域专家的负担,改善用户对知识共同理解的程度,提高导航的协作能力、知识共享能力,能够向用户提供较高效的知识服务。  相似文献   

14.
期刊论文与专利文献之间的有效链接有利于提高它们的利用率、加强基础研究与应用研究的联系和实现知识增值,但当前两者缺乏有效的关联和共享渠道。文章分析了期刊论文与专利文献之间的异构特性,提出了建立两者链接关系的研究框架,通过CLC与IPC的类目映射、创新主题提取和基于叙词表的语义相似度计算来解决异构科技文献链接中存在的问题。本文研究目的是探讨异构资源整合的技术路径,为期刊论文与专利文献有效链接的建立提供研究思路。  相似文献   

15.
周露  王梅 《图书馆论坛》2006,26(4):143-146
长江是中国文明的起源,我们建设了长江知识库。长江知识库是利用信息管理理论和方法,采用元数据与本体相结合的方法描述知识概念,用虚拟总库方法实现知识库的管理,建立适合信息领域的专题知识库。文章介绍了概念设计方法,分析与设计了长江知识库的概念模型、系统构架、系统流程和系统模块。  相似文献   

16.
提出一种基于引用关系构建知识库的方法,通过提取文献间相互引用的知识内容来建设知识库.把该方法应用于图书情报学科领域行试验,试验结果表明该方法是可行的.最后探讨了该方法需要进一步改进和完善的地方.  相似文献   

17.
[目的/意义]面对海量专利文献,如何使用户快速、精准地掌握知识,是优化专利服务的关键课题.中文专利文献中大量存在的零形回指现象,严重影响了知识的自动识别与提取,但由于专利文献零形回指识别与消解涉及到众多文本分析技术及特定资源建设,因此,目前尚未发现针对性研究.[方法/过程]在物性结构理论、语义角色及修辞结构关系理论的指导下,展开相关规则的研究,开发句法及语义角色标注工具和篇章标注工具两种工具,并构建了4个资源库:①"专利动词物性角色库",将专利的动词归纳为4类;②"专利知识论元结构库",用于自动标注专利动词物性角色及其论元结构;③"专利动词论元结构规则库",用于分析零形回指的先行语;④"零形回指修辞结构类型库",用于分析当零形回指搭配"功能角色"和"部件角色"的情况.[结果/结论]通过资源库的建设,得出5条消解规则.初步成果已成功应用于机械领域专利文献的自动处理工作.  相似文献   

18.
基于本体面向专家的知识服务系统应用模型   总被引:4,自引:0,他引:4  
庄鹏  张惠惠 《图书馆杂志》2004,23(12):49-52
下一代Web——语义Web的标准中把本体作为其体系架构中承上启下的语义表示层,使得基于本体的知识服务系统的研究成为提供基于语义和内容检索能力的基础和要求。本文在讨论了本体及基于本体的知识服务,并分析了专家学者对于学术资料的需求和可用学术资源后,建立出一个面向专家学者的基于本体的知识服务系统的应用模型,并对模型中的三大模块进行分析和介绍,最后说明了构建这个系统本体的一些问题和系统实现的现实意义。  相似文献   

19.
中医药本体构建研究   总被引:5,自引:0,他引:5  
利用自然语言处理(NLP)理论和技术方法对中医药领域中已有的公认领域知识进行了重构与利用,在成功实现了中医药学知识描述体系的自动构建与获取的基础上,利用领域专家知识,实现了受限文本的Ontology自学习机制,并对领域本体的进化进行了有益的探索,有效地解决了Ontology研究的瓶颈问题,从而为中医药知识的挖掘与利用奠定了数据基础。从目前看来,这是一种较为理想、实用的方法,为专业领域Ontology的自动构建提供了理论依据及技术支持。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号