首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 127 毫秒
1.
认为主题词表有利于信息的组织、信息的利用和信息的检索,传统的手工构建单语言主题词表的方法耗时且成本昂贵,难以满足用户对跨语言信息的处理和使用需求。目前在国内外,如何利用计算机技术,实现跨语言主题词表的自动构建功能是信息检索研究领域需要解决的一个关键问题。在对国内外研究现状进行分析的基础上,较为详细地阐述和分析跨语言主题词表自动构建技术的思想及其技术方法,并提出相关的研究建议。  相似文献   

2.
电子政务主题词表是电子政务信息的组织和检索的重要语义工具。传统手工编制叙词表的方法耗费大量人力、物力,成本高、历时长,已不再适用于网络环境。本文拟以共青团电子政务词表为例,探讨用计算机自动构建叙词表的方法。主要技术要点包括:利用N-gram方法进行选词、结合Dice测度、相似度算法、模式匹配等多种技术来自动识别词汇的等同、等级和相关关系。最后评测了自动构建的电子政务主题词表的性能。  相似文献   

3.
叙词表互操作技术研究——教育集成词库的试验   总被引:2,自引:1,他引:1  
目前,国内外信息领域都在致力于情报检索语言的互操作研究.介绍了基于词表结构的自动匹配和基于同义词表的语词匹配两种互操作技术.以教育类数据为例,选取了<中国分类主题词表>、<教育主题词表>、<社会科学检索词表>等叙词表,采用构建集成词库的方法实现不同叙词表间的兼容.  相似文献   

4.
本文以干细胞研究文献为例,以医学主题词表(Medical Subject Headings,Me SH)为基础,通过对主题词进行分类,对知识进行重构,使同一类别的文献通过同一类别的主题词聚集在一起,构建了面向情报学分析的分类主题词表,解决专题文献检索问题,并通过检索实验验证了构建的分类词表的有效性。为进一步实现基于分类词表的文献分类导航和文献自动归类,最终为科技管理服务奠定基础。  相似文献   

5.
《汉语主题词表》XML文档的实现对于提高词表的利用效率具有重要意义。在详细分析《汉语主题词表》各数据表之间逻辑关系基础上,利用JDOM技术实现《汉语主题词表》XML文档的自动生成。  相似文献   

6.
文章在对自动标引技术的原理、方法及划分、国内外研究发展现状和自动标引技术的优势简单介绍的基础上,提出了基于《中国分类主题词表》的文本自动标引系统的设计方案并对文本数据自动标引系统的流程及标引工作自动化处理过程进行了详细阐述.  相似文献   

7.
电子政务主题词表自动构建研究   总被引:4,自引:0,他引:4  
电子政务主题词表是电子政务信息组织和检索的重要语义工具。传统手工编制叙词表的方法已不再适用于网络环境。电子政务词表的自动构建技术主要有基于N-gram方法的词汇收集和选择词间关系的自动识别。要想编制一部性能优越且容易应用的词表,应将计算机自动构建与传统方式编制结合起来,取长补短。表7。参考文献10。  相似文献   

8.
一种基于主题词表的快速中文文本分类技术   总被引:1,自引:0,他引:1  
针对中文文本的自动分类问题,提出了一种新的算法.该算法的基本思路是构造一个带权值的分类主题词表,该词表采用键树的方式构建,然后利用哈希杂凑法和长词匹配优先原则在主题词表中匹配待分类的文档中的字符串,并统计匹配成功的权值和,以权值和最大者作为分类结果.本算法可以避开中文分词的难点和它对分类结果的影响.理论分析和实验结果表明,该技术分类结果的准确度和时间效率都比较高,其综合性能达到了目前主流技术的水平.  相似文献   

9.
顾颖  何琳 《图书情报工作》2012,(19):109-113
认为中文文献数据库中存在大量的分类号与关键词(或主题词)对应的人工标引记录。通过对这些标引记录信息进行聚合处理,可以实现计算机自动编制分类主题词表。比较两种分类主题词表的编制模式,讨论机编分类主题词表的优势,针对机编分类主题词表已有的成果——知识库的不足之处提出改进方案。改进方案在小规模测试集中取得了良好的效果。最后分析将机编分类主题词表技术应用于新一代《中国分类主题词表》升级改造的良好前景。  相似文献   

10.
本文在对比《汉语主题词表》(自然科学)增订本与第一版的基础上,对《增订本》在各个方面的新进展及其优越性进行了评论,同时论述了《汉语主题词表》对中文自动标引研究工作的积极意义,并从中文自动标引的角度探讨了《汉语主题词表》的发展前景。  相似文献   

11.
多语叙词表是实现多语言信息组织和检索,满足日益增长的多语言信息需求的重要工具资源。首先介绍多语叙词表构建的研究现状和3种主要构建方法,并对基于翻译构建多语叙词表的方法及该方法的不足进行分析,然后从汉化方法、汉语词汇的选取原则、叙词表辅助汉化平台的构建及汉化结果评价4个方面对英语EI叙词表和日语JST叙词表的汉化工作进行介绍,最后探讨下一步的研究工作。  相似文献   

12.
网络环境中汉语叙词表的自动构建研究   总被引:2,自引:0,他引:2  
为解决网络信息检索效率低的问题,需要把叙词表等控制机制引入到网络检索系统中,但传统词表编制方式已经不能满足网络信息检索的需要.本文制定了一种汉语叙词表自动构建方案,以财税领域为例,采用模式识别、词聚类、同现分析等自然语言处理技术实现自动识别词间等同关系、等级关系和相关关系,从而构建一部财税领域叙词表,最后对所构建的叙词表进行测评.相比传统叙词表编制方法,自动构建叙词表能降低编表专家的智力负担,而且编表时间短,费用低,时效性强,符合普通用户的检索习惯.但对词间关系的识别不如人工编表时精当可靠,所以需要人工辅助判定.  相似文献   

13.
以信息检索技术为脉络,结合Ei Village 2、ISI Web of Knowledge、CSA IDS、EBSCO Host、ProQuest Online等多个著名检索平台综合分析布尔逻辑、位置逻辑、模糊检索技术、网络叙词表构建技术在网络数据库的应用,研究表明信息检索技术已深深植入网络信息资源管理之中,深入剖析信息检索技术,可以清晰揭示提问表达式的构建机理,掌握网络数据库的原理及使用方法,为网络信息资源评价和建设提供依据。  相似文献   

14.
基于Topic Maps的叙词表再工程   总被引:3,自引:0,他引:3  
利用主题图技术构建一个在线叙词表。在分析传统叙词表的词间关系及其不足的基础上,从现有叙词表中选取18个叙词作为研究样本,分析其词间关系并进行建模;最后结合新兴的主题图技术,用Ontopia公司提供的Ontopoly创建出主题图,并用Omnigator和Vizigator分别进行在线浏览和可视化呈现。  相似文献   

15.
基于概念格的异构资源领域本体构建研究   总被引:1,自引:0,他引:1  
在对本体构建研究路径进行分析的基础上,阐述以概念格构建异构资源领域本体的内在机理和技术路线。通过概念格的并叠置运算,获得基于主题词表和文本两大异构资源的概念格。进而以异构资源概念格构建异构资源领域本体,并对异构资源领域本体的构建进行讨论。为数字图书馆构建异构资源领域本体做出探索。  相似文献   

16.
分析主题词表社会应用的现状和目标,从三个方面说明主题词表社会应用的意义与价值;在阐释当前主题词表社会应用的难点之后,提出主题词表社会应用研究的理论建设要求;并基于国内外主题词表社会应用的实践,提出针对主题词表社会应用的模式、机制和方案的具体建议。  相似文献   

17.
������ʱ����峡�������   总被引:4,自引:0,他引:4  
通过对我国已出版的多部叙词表的调查分析,认为汉语叙词表语义场的构成有其一定的特点和规律,等同义场和相关义场的构造是汉语叙词表编制的薄弱环节。介绍自然语言叙词表的特点及计算机自动构造的三种方法,指出基于文本的叙词表自动构造方法与汉语的词法相结合,将有助于对汉语叙词表等同义场、等级义场和相关义场的构建。  相似文献   

18.
通过汇总我国词表建设历史成果,结合当前信息技术发展新趋势,系统地剖析维基百科迅速发展壮大的原因;提出在维基百科开放与协同工作的理念上,规划我国词表的宏观管理、多渠道来源加工体系以及词表结构设计,由此构建出我国全新的词表建设总体框架,设计词表建设及其应用服务的全新模式,并指出若干重点领域的应用示范。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号