首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 109 毫秒
1.
用于中文信息自动分类的《中图法》知识库的构建   总被引:1,自引:0,他引:1  
分类号、主题词、关键词是三种主题概念标识,三者之间存在着概念对应关系,即兼容关系。中文文献数据库中存在着大量的分类号与关键词(或主题词)对应的人工标引记录。通过对这些数据的加工整理,以《中图法》类目体系为主干组织各学科领域的语词,从而构建出反映分类号与语词概念对应关系的《中图法》知识库,用以实现信息的自动标引和自动分类。本文详细讨论了该知识库的构建原理、结构、编制使用的关键技术以及主要应用等。  相似文献   

2.
基于知识库的网页自动标引和自动分类系统的设计   总被引:15,自引:0,他引:15  
针对中文网页文本信息特征,提出了信息标引和组织方案,并构建了一个基于知识库的网页自动标引和自动分类系统。中文网页的自动标引和自动分类思想主要基于知识库进行。知识库实际上是一个基于《中图法》的专家知识系统,包括了中图法库、汉表库、分类号主题词对应库、同义词库、关键词库等若干数据库。在确定网页基本信息标引源的基础上,中文网页主题标引运用了基于词频的统计加权法;通过与分类号一主题词对应库主题词串的词面相似度计算,进一步完成中文网页的分类标引。最后还讨论了新词识别等技术问题。  相似文献   

3.
顾颖  何琳 《图书情报工作》2012,(19):109-113
认为中文文献数据库中存在大量的分类号与关键词(或主题词)对应的人工标引记录。通过对这些标引记录信息进行聚合处理,可以实现计算机自动编制分类主题词表。比较两种分类主题词表的编制模式,讨论机编分类主题词表的优势,针对机编分类主题词表已有的成果——知识库的不足之处提出改进方案。改进方案在小规模测试集中取得了良好的效果。最后分析将机编分类主题词表技术应用于新一代《中国分类主题词表》升级改造的良好前景。  相似文献   

4.
中文信息自动分类用知识库的设计与构建   总被引:11,自引:2,他引:9  
侯汉清  薛鹏军 《情报学报》2003,22(6):681-686
在计算机智能处理技术远未成熟的情况下 ,基于概念语义网络的自动分类采用知识库技术 ,仍将是一种实用的选择。本项研究根据分类语言、主题语言、自然语言三者兼容互换的原理 ,以众多标引员的主题标引和分类标引的经验 ,即文献数据库实体中大量存在的文献分类号和主题词双重标引数据为基础 ,建立一个以《中图法》为基础的的分类知识库———分类法与主题词表对照数据库。论文对构建分类知识库的思路、步骤及主要技术 ,包括关联度测度方案、标引词模式匹配、新词增补等进行了讨论  相似文献   

5.
《中国分类主题词表》的修订方案和方法的探讨   总被引:1,自引:0,他引:1  
《中国分类主题词表》出版已有九年,急待修订。本文比较了两种修订《中国分类主题词表》的方案。一种方案是侧重于利用计算机和现成的数据库标引数据编制分类号-主题词对照数据库,先修订第一表,再反向对照修订第二表。另一种方案利用现有数据库进行主题词的标引频率统计,先对第二表中的主题词进行增删改,然后再修订第一表的对应词串。最后重点介绍了编制分类号-主题词对照数据库、修订《中国分类主题词表》的关键技术和步骤。  相似文献   

6.
本文探讨了基于自动标引的《中国分类主题词表》(简称《中分表》)改造的模式、结构以及关键技术。在原《中分表》分类体系的框架之上,收集标引经验库中分类标引和主题标引的双重标引数据及其他相关数据,应用支持度、置信度和相关度等筛选处理方法,最终得出分类号与关键词(串)的最佳对应关系组合。本文从收词量、相符度、专指度、标引深度、主题标引能力和分类标引能力6个方面详细地对改造后的《中分表》进行了测试,结果表明改造后的《中分表》在编制方式、类目设置、收词量、全面性和专指性等方面都具有一定优势。建议在《中分表》的更新改造中,尽量采用立体化的整体结构,保证完备的收词量,进行必要的分级化控制并扩大用户交互。  相似文献   

7.
分类表-叙词表转换系统的设计   总被引:7,自引:2,他引:5  
张雪英  侯汉清 《情报学报》2000,19(4):342-348
本文针对手工建立分类表-叙词表转换系统的缺点,用计算机设计了一个分类表-叙词表转换系统。系统以文献数据库标引数据(《中图法》及《汉语主题词表》)为实验对象,以金融银行学科为例建立了四种标引词(串)与分类号的对应模型,采用LogL统计方法实现分类号与主题词的自动对应和人工辅助筛选,并设置了模糊转换和精确转换两种分类号与主题词转换的模式。  相似文献   

8.
关于《教育主题词表·中图法教育专业分类表》的几点修改补充建议陈南玉(湛江师范学院图书馆)关键词主题标引分类标引教育文献1主题词表与《中图法》专业分类表应能互相转查。建议在字顺叙词表加上对应的专业分类表中的分类号索引;在专业分类表的附加主题词之后加上字...  相似文献   

9.
使用基于《中图法》知识库的中文信息自动标引和自动分类系统,对中文图书进行自动标引与自动分类的实验,以测试该系统对图书的适用性。实验通过对中文图书进行计算机自动标引与自动分类、人工打分测评、测试结果统计分析,得出中文图书的各标引源主题表达能力依次为:书名、内容提要、两级目次、参考文献、一级目次,在此基础上对标引源进行加权设计,权值设为5:3:2:2。实验证明该系统用于中文图书的自动标引与自动分类是可行的。表6。参考文献9。  相似文献   

10.
“蝎子计划(Scorpion Project)”是美国OCLC利用《杜威十进分类法》电子编辑支持系统(ESS)对数字信息资源进行自动分类和主题识别的一个研究项目。本文简要介绍了该项目的进展情况、实施原理,描述了Scorpion对数字信息资源进行自动分类和主题识别的具体流程,并将其与我们自行研发的基于《中图法》知识库的中文信息自动标引和自动分类系统进行对比分析,以探讨Scorpion对中文信息自动分类和主题识别的借鉴意义。  相似文献   

11.
论文论述了分类法、主题法、分类主题一体化法以及本体论等知识组织方法的系统论基础。  相似文献   

12.
从图书馆的角度看信息组织和知识组织   总被引:3,自引:0,他引:3  
图书馆是一个为信息资源建立检索点,并为用户提供服务的机构。立足于此,应明确几个问题:信息组织实是信息资源的组织,分类标引不是信息组织的全部;图书馆的知识组织主要研究知识分类,图书馆的知识组织不是知识组织的全部。图书馆大可不必为自己的信息资源组织工作而妄自菲薄。表3。参考文献18。  相似文献   

13.
文章首先介绍了汉语科技词系统的体系结构和功能,其次设计了自动赋词标引研究的整体思路,完成了自动赋词标引的系统功能实现,包括标引知识库的格式转换、算法实现和系统实现,并收集语料进行测试。最后对自动赋词标引的结果进行了分析,并且总结了该自动赋词标引研究的特点和不足,介绍了未来的工作设想。  相似文献   

14.
主要介绍在机构知识库系统中集成开放知识组织引擎OpenKOS相关功能,利用OpenKOS的开放服务接口对机构知识库中知识产出进行主题标引和提供基于规范主题词的分面浏览,并实现对检索结果进行DDC聚类浏览的服务功能。系统投入应用后初步达到结合传统知识组织方式,对数字资源实现自动标引与自动分类的目标。  相似文献   

15.
自动标引研究的回顾与展望*   总被引:3,自引:0,他引:3  
对自动标引的研究进行总结与回顾。对标引对象进行界定;分析自动标引研究的3个阶段,并列出50年研究历程中的代表性方法;详细描述自动标引研究路线图、并对抽词标引与赋词标引方法进行详细分类;最后指出自动标引中存在的问题,并对今后的自动标引研究和应用方向进行展望。  相似文献   

16.
本文围绕我国文献分类、编目与主题法等知识组织类课程的教学现状,从开设课程的学校院系、课程教学内容、教材建设等方面进行总结,分析存在的问题,提出了课程教学的改进与发展设想。  相似文献   

17.
分析MBA类图书分类标引现状;并对总论“MBA”类图书归入不同类目是否妥当,作深入的探讨;并依据MBA类图书学科属性、《中图法》(第五版)F2经济管理类目体系、文献分类学知识,明确此类文献在《中图法》(第五版)中的合理归类.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号