共查询到17条相似文献,搜索用时 109 毫秒
1.
用于中文信息自动分类的《中图法》知识库的构建 总被引:1,自引:0,他引:1
分类号、主题词、关键词是三种主题概念标识,三者之间存在着概念对应关系,即兼容关系。中文文献数据库中存在着大量的分类号与关键词(或主题词)对应的人工标引记录。通过对这些数据的加工整理,以《中图法》类目体系为主干组织各学科领域的语词,从而构建出反映分类号与语词概念对应关系的《中图法》知识库,用以实现信息的自动标引和自动分类。本文详细讨论了该知识库的构建原理、结构、编制使用的关键技术以及主要应用等。 相似文献
2.
基于知识库的网页自动标引和自动分类系统的设计 总被引:15,自引:0,他引:15
针对中文网页文本信息特征,提出了信息标引和组织方案,并构建了一个基于知识库的网页自动标引和自动分类系统。中文网页的自动标引和自动分类思想主要基于知识库进行。知识库实际上是一个基于《中图法》的专家知识系统,包括了中图法库、汉表库、分类号主题词对应库、同义词库、关键词库等若干数据库。在确定网页基本信息标引源的基础上,中文网页主题标引运用了基于词频的统计加权法;通过与分类号一主题词对应库主题词串的词面相似度计算,进一步完成中文网页的分类标引。最后还讨论了新词识别等技术问题。 相似文献
3.
认为中文文献数据库中存在大量的分类号与关键词(或主题词)对应的人工标引记录。通过对这些标引记录信息进行聚合处理,可以实现计算机自动编制分类主题词表。比较两种分类主题词表的编制模式,讨论机编分类主题词表的优势,针对机编分类主题词表已有的成果——知识库的不足之处提出改进方案。改进方案在小规模测试集中取得了良好的效果。最后分析将机编分类主题词表技术应用于新一代《中国分类主题词表》升级改造的良好前景。 相似文献
4.
中文信息自动分类用知识库的设计与构建 总被引:11,自引:2,他引:9
在计算机智能处理技术远未成熟的情况下 ,基于概念语义网络的自动分类采用知识库技术 ,仍将是一种实用的选择。本项研究根据分类语言、主题语言、自然语言三者兼容互换的原理 ,以众多标引员的主题标引和分类标引的经验 ,即文献数据库实体中大量存在的文献分类号和主题词双重标引数据为基础 ,建立一个以《中图法》为基础的的分类知识库———分类法与主题词表对照数据库。论文对构建分类知识库的思路、步骤及主要技术 ,包括关联度测度方案、标引词模式匹配、新词增补等进行了讨论 相似文献
5.
6.
本文探讨了基于自动标引的《中国分类主题词表》(简称《中分表》)改造的模式、结构以及关键技术。在原《中分表》分类体系的框架之上,收集标引经验库中分类标引和主题标引的双重标引数据及其他相关数据,应用支持度、置信度和相关度等筛选处理方法,最终得出分类号与关键词(串)的最佳对应关系组合。本文从收词量、相符度、专指度、标引深度、主题标引能力和分类标引能力6个方面详细地对改造后的《中分表》进行了测试,结果表明改造后的《中分表》在编制方式、类目设置、收词量、全面性和专指性等方面都具有一定优势。建议在《中分表》的更新改造中,尽量采用立体化的整体结构,保证完备的收词量,进行必要的分级化控制并扩大用户交互。 相似文献
7.
分类表-叙词表转换系统的设计 总被引:7,自引:2,他引:5
本文针对手工建立分类表-叙词表转换系统的缺点,用计算机设计了一个分类表-叙词表转换系统。系统以文献数据库标引数据(《中图法》及《汉语主题词表》)为实验对象,以金融银行学科为例建立了四种标引词(串)与分类号的对应模型,采用LogL统计方法实现分类号与主题词的自动对应和人工辅助筛选,并设置了模糊转换和精确转换两种分类号与主题词转换的模式。 相似文献
8.
关于《教育主题词表·中图法教育专业分类表》的几点修改补充建议陈南玉(湛江师范学院图书馆)关键词主题标引分类标引教育文献1主题词表与《中图法》专业分类表应能互相转查。建议在字顺叙词表加上对应的专业分类表中的分类号索引;在专业分类表的附加主题词之后加上字... 相似文献
9.
10.
“蝎子计划(Scorpion Project)”是美国OCLC利用《杜威十进分类法》电子编辑支持系统(ESS)对数字信息资源进行自动分类和主题识别的一个研究项目。本文简要介绍了该项目的进展情况、实施原理,描述了Scorpion对数字信息资源进行自动分类和主题识别的具体流程,并将其与我们自行研发的基于《中图法》知识库的中文信息自动标引和自动分类系统进行对比分析,以探讨Scorpion对中文信息自动分类和主题识别的借鉴意义。 相似文献
11.
12.
从图书馆的角度看信息组织和知识组织 总被引:3,自引:0,他引:3
图书馆是一个为信息资源建立检索点,并为用户提供服务的机构。立足于此,应明确几个问题:信息组织实是信息资源的组织,分类标引不是信息组织的全部;图书馆的知识组织主要研究知识分类,图书馆的知识组织不是知识组织的全部。图书馆大可不必为自己的信息资源组织工作而妄自菲薄。表3。参考文献18。 相似文献
13.
14.
15.
自动标引研究的回顾与展望* 总被引:3,自引:0,他引:3
章成志 《现代图书情报技术》2007,2(11):33-39
对自动标引的研究进行总结与回顾。对标引对象进行界定;分析自动标引研究的3个阶段,并列出50年研究历程中的代表性方法;详细描述自动标引研究路线图、并对抽词标引与赋词标引方法进行详细分类;最后指出自动标引中存在的问题,并对今后的自动标引研究和应用方向进行展望。 相似文献
16.
17.
关于MBA类图书在《中国图书馆分类法》(第五版)中合理归类的探讨 总被引:1,自引:0,他引:1
分析MBA类图书分类标引现状;并对总论“MBA”类图书归入不同类目是否妥当,作深入的探讨;并依据MBA类图书学科属性、《中图法》(第五版)F2经济管理类目体系、文献分类学知识,明确此类文献在《中图法》(第五版)中的合理归类. 相似文献