首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 15 毫秒
1.
网络环境中汉语叙词表的自动构建研究   总被引:2,自引:0,他引:2  
为解决网络信息检索效率低的问题,需要把叙词表等控制机制引入到网络检索系统中,但传统词表编制方式已经不能满足网络信息检索的需要.本文制定了一种汉语叙词表自动构建方案,以财税领域为例,采用模式识别、词聚类、同现分析等自然语言处理技术实现自动识别词间等同关系、等级关系和相关关系,从而构建一部财税领域叙词表,最后对所构建的叙词表进行测评.相比传统叙词表编制方法,自动构建叙词表能降低编表专家的智力负担,而且编表时间短,费用低,时效性强,符合普通用户的检索习惯.但对词间关系的识别不如人工编表时精当可靠,所以需要人工辅助判定.  相似文献   

2.
电子政务主题词表是电子政务信息的组织和检索的重要语义工具。传统手工编制叙词表的方法耗费大量人力、物力,成本高、历时长,已不再适用于网络环境。本文拟以共青团电子政务词表为例,探讨用计算机自动构建叙词表的方法。主要技术要点包括:利用N-gram方法进行选词、结合Dice测度、相似度算法、模式匹配等多种技术来自动识别词汇的等同、等级和相关关系。最后评测了自动构建的电子政务主题词表的性能。  相似文献   

3.
电子政务主题词表自动构建研究   总被引:4,自引:0,他引:4  
电子政务主题词表是电子政务信息组织和检索的重要语义工具。传统手工编制叙词表的方法已不再适用于网络环境。电子政务词表的自动构建技术主要有基于N-gram方法的词汇收集和选择词间关系的自动识别。要想编制一部性能优越且容易应用的词表,应将计算机自动构建与传统方式编制结合起来,取长补短。表7。参考文献10。  相似文献   

4.
������ʱ����峡�������   总被引:4,自引:0,他引:4  
通过对我国已出版的多部叙词表的调查分析,认为汉语叙词表语义场的构成有其一定的特点和规律,等同义场和相关义场的构造是汉语叙词表编制的薄弱环节。介绍自然语言叙词表的特点及计算机自动构造的三种方法,指出基于文本的叙词表自动构造方法与汉语的词法相结合,将有助于对汉语叙词表等同义场、等级义场和相关义场的构建。  相似文献   

5.
基于传统知识组织资源的本体自动构建   总被引:3,自引:1,他引:2  
本文介绍了基于现有的知识组织工具和书目数据资源自动构建本体的方法:首先根据书目数据揭示的领域知识建立一个用OWL描述的数据模型,然后从词表、类表和书目数据集中自动抽取对象和关系的实例,写入OWL数据模型,形成书目本体.这是构建本体的一条经济、高效、合理且实用的道路.基于该本体,不仅可以实现概念浏览和语义检索,还可以增强搜索引擎的功能,通过词汇服务实现检索词提示和搜索结果归类.基于<中国分类主题词表>和计算机类的书目数据,本文实现了一个语义检索系统KVision,展现了传统知识组织资源对于网络信息资源利用的潜在价值.  相似文献   

6.
国家叙词库的体系结构与数据模型   总被引:2,自引:2,他引:0  
国家叙词库是我国叙词表资源集成与服务系统,体系结构包括三层:数据获取与转换层、存储与语义集成层、服务与应用层。数据获取与转换层实现叙词表数据的采集、规范描述和格式转换;语义集成采用中心词表集成模式,顶层为分类表和本体,中间为概念层,底层为基础词库;服务方面,采用渐进服务思路,提供不同颗粒度和不同语义层次的数据服务。叙词表宏观结构方面,将叙词表及其各组成部分作为独立概念体系,通过描述概念体系间的关联,表达叙词表宏观结构;微观结构方面,将概念和词汇分别作为描述对象,词汇作为概念标签,在概念层面描述语义属性,在词汇层面描述非语义属性。基于DC元数据框架设计叙词表元数据方案,基于SKOS+XL设计概念和词汇描述的元数据方案。图3。表3。参考文献19。  相似文献   

7.
传统叙词表的本体化构建是目前叙词表发展的重要方向。当前叙词表转换为本体的描述语言有XML(S)、RDF(S)、SKOS、OWL等,文章通过对几种典型的描述语言和叙词表之间的语义关系进行映射分析,从描述能力、人工干预、应用性三个层面总结了描述语言在表示叙词表语义关系方面的差异性。该研究不仅有助于传统叙词表在语义环境下进行发展,而且对于本体描述语言的完善具有非常重要的作用。  相似文献   

8.
基于SKOS 的国防科学技术叙词表向本体的转换研究   总被引:2,自引:0,他引:2  
本文对通过<国防科学技术叙词表>来构建国防科技领域本体进行了研究.文章简要介绍了几种本体描述语言,在详细描述W3C 新推出的本体描述语言标准SKOS 的基础上,结合<国防科学技术叙词表>分析了SKOS 对于概念、属性、映射的描述方法.SKOS 具有简单、系统、全面的特点,使得本体的构建更为方便、高效,为国防领域的知识共享和重用奠定了基础.在本文的实例部分,介绍分析了<国防科学技术叙词表>,尤其是词表中的字顺表所包含的主要语义关系,之后节选了词表的枪械部分段落,在详细分析枪械体系中的概念和其中的关联关系等的基础上完成了本体的转换.  相似文献   

9.
陈瑞  曾建勋 《情报学报》2022,(4):401-411
众多叙词表及术语资源由于资源分散、更新维护慢、不能满足数据大规模应用需要,导致应用情况不理想。叙词表的集成化可对现有信息资源进行充分整合,有助于优化知识组织体系,拓展术语资源的应用范围。本文提出的叙词表集成化体系框架涵盖了标准规范体系、词表集成化支撑体系、词表集成化概念体系、叙词表集成化过程和方法以及系统服务与应用五个方面。集成化过程是在多来源术语集成构建词汇集成库的基础上,进行概念映射、概念融合与关系校验实现概念和概念关系的语义集成,构建一个覆盖多学科领域的、语义关系多样的集成化词表。最后,本文提出了推进集成资源的智能化服务和社会场景应用的具体策略,推动叙词表资源的可持续发展。  相似文献   

10.
基于概念空间方法的信息检索技术研究   总被引:14,自引:0,他引:14  
为了解决词汇差异问题,词表构造在信息检索系统中有着重要意义。概念空间方法是利用计算机自动构造概念语义网络(词表)并以此为基础进行概念检索的一种方法。由词语作为语义网络的节点,词语之间的关联权重以一个给定文档集合中词语的共现率来计算,其大小代表它们之间的相似性。检索时系统采用人工智能方法激活与检索入口词相关的术语或概念,为用户提供交互式的检索用语建议。方法的具体步骤包括文档和对象列表收集、对象过滤和自动标引、共现分析和联想检索四个阶段。这种方法多用于英文检索系统,但对我国的信息检索系统也有重要的借鉴意义。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号