首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
用于中文信息自动分类的《中图法》知识库的构建   总被引:4,自引:0,他引:4  
中文文献数据库中存在着大量的分类号与关键词(或主题词)对应的人工标引记录。通过对这些数据的加工整理,以《中图法》类目体系为主干,组织各学科领域的语词,从而构建出反映分类号与语词概念对应关系的《中图法》知识库,用以实现信息的自动标引和自动分类。构建《中图法》知识库面临着一些难题:异构数据的整合;原始数据中分类号与主题词或词串之间一对多、多对多关系的筛选;标引词串与知识库中的词串的相符性比较等。图2。参考文献8。  相似文献   

2.
基于知识库的网页自动标引和自动分类系统的设计   总被引:15,自引:0,他引:15  
针对中文网页文本信息特征,提出了信息标引和组织方案,并构建了一个基于知识库的网页自动标引和自动分类系统。中文网页的自动标引和自动分类思想主要基于知识库进行。知识库实际上是一个基于《中图法》的专家知识系统,包括了中图法库、汉表库、分类号主题词对应库、同义词库、关键词库等若干数据库。在确定网页基本信息标引源的基础上,中文网页主题标引运用了基于词频的统计加权法;通过与分类号一主题词对应库主题词串的词面相似度计算,进一步完成中文网页的分类标引。最后还讨论了新词识别等技术问题。  相似文献   

3.
顾颖  何琳 《图书情报工作》2012,(19):109-113
认为中文文献数据库中存在大量的分类号与关键词(或主题词)对应的人工标引记录。通过对这些标引记录信息进行聚合处理,可以实现计算机自动编制分类主题词表。比较两种分类主题词表的编制模式,讨论机编分类主题词表的优势,针对机编分类主题词表已有的成果——知识库的不足之处提出改进方案。改进方案在小规模测试集中取得了良好的效果。最后分析将机编分类主题词表技术应用于新一代《中国分类主题词表》升级改造的良好前景。  相似文献   

4.
中文信息自动分类用知识库的设计与构建   总被引:11,自引:2,他引:9  
侯汉清  薛鹏军 《情报学报》2003,22(6):681-686
在计算机智能处理技术远未成熟的情况下 ,基于概念语义网络的自动分类采用知识库技术 ,仍将是一种实用的选择。本项研究根据分类语言、主题语言、自然语言三者兼容互换的原理 ,以众多标引员的主题标引和分类标引的经验 ,即文献数据库实体中大量存在的文献分类号和主题词双重标引数据为基础 ,建立一个以《中图法》为基础的的分类知识库———分类法与主题词表对照数据库。论文对构建分类知识库的思路、步骤及主要技术 ,包括关联度测度方案、标引词模式匹配、新词增补等进行了讨论  相似文献   

5.
何琳  侯汉清 《中国索引》2006,4(1):39-43
由于《中国图书馆分类法》的类目数目庞大和文献在各类目上分布的不均衡,导致基于机器统计学习的自动分类技术在此类多层分类上的力不从心。基于人工标引经验的自动分类试图通过情报检索语言兼容互换的原理解决这一问题,然而直接应用标引词串对分类进行匹配在实际应用中产生了一系列的问题。本文试图通过两种分类技术相结合的方法对信息资源进行分类,提出了用相关度度量来测定关键词和类目概念之间的关联,构建关键词、分类号、归属度三元组矩阵的方法进行分类匹配,并在小规模的测试集上得到了较好的效果。本文详细讨论此种分类器的构建原理、构建方法以及分类流程,并对该方法存在的不足进行了分析。  相似文献   

6.
关于《教育主题词表·中图法教育专业分类表》的几点修改补充建议陈南玉(湛江师范学院图书馆)关键词主题标引分类标引教育文献1主题词表与《中图法》专业分类表应能互相转查。建议在字顺叙词表加上对应的专业分类表中的分类号索引;在专业分类表的附加主题词之后加上字...  相似文献   

7.
“蝎子计划(Scorpion Project)”是美国OCLC利用《杜威十进分类法》电子编辑支持系统(ESS)对数字信息资源进行自动分类和主题识别的一个研究项目。本文简要介绍了该项目的进展情况、实施原理,描述了Scorpion对数字信息资源进行自动分类和主题识别的具体流程,并将其与我们自行研发的基于《中图法》知识库的中文信息自动标引和自动分类系统进行对比分析,以探讨Scorpion对中文信息自动分类和主题识别的借鉴意义。  相似文献   

8.
本文探讨了基于自动标引的《中国分类主题词表》(简称《中分表》)改造的模式、结构以及关键技术。在原《中分表》分类体系的框架之上,收集标引经验库中分类标引和主题标引的双重标引数据及其他相关数据,应用支持度、置信度和相关度等筛选处理方法,最终得出分类号与关键词(串)的最佳对应关系组合。本文从收词量、相符度、专指度、标引深度、主题标引能力和分类标引能力6个方面详细地对改造后的《中分表》进行了测试,结果表明改造后的《中分表》在编制方式、类目设置、收词量、全面性和专指性等方面都具有一定优势。建议在《中分表》的更新改造中,尽量采用立体化的整体结构,保证完备的收词量,进行必要的分级化控制并扩大用户交互。  相似文献   

9.
《中国分类主题词表》的修订方案和方法的探讨   总被引:1,自引:0,他引:1  
《中国分类主题词表》出版已有九年,急待修订。本文比较了两种修订《中国分类主题词表》的方案。一种方案是侧重于利用计算机和现成的数据库标引数据编制分类号-主题词对照数据库,先修订第一表,再反向对照修订第二表。另一种方案利用现有数据库进行主题词的标引频率统计,先对第二表中的主题词进行增删改,然后再修订第一表的对应词串。最后重点介绍了编制分类号-主题词对照数据库、修订《中国分类主题词表》的关键技术和步骤。  相似文献   

10.
关于《中国分类主题词表》历史,地理类的对应   总被引:1,自引:0,他引:1  
关于《中国分类主题词表》历史、地理类的对应杨鸣放(辽宁省图书馆)《中国分类主题词表》是将《中国图书馆图书分类法》(以下称《中图法》)第三版中的实有类目与《汉语主题词表》(以下称《汉表》)中的正式主题词在概念上进行对应转换,从而形成分类号与主题词兼容互...  相似文献   

11.
分类表-叙词表转换系统的设计   总被引:7,自引:2,他引:5  
张雪英  侯汉清 《情报学报》2000,19(4):342-348
本文针对手工建立分类表-叙词表转换系统的缺点,用计算机设计了一个分类表-叙词表转换系统。系统以文献数据库标引数据(《中图法》及《汉语主题词表》)为实验对象,以金融银行学科为例建立了四种标引词(串)与分类号的对应模型,采用LogL统计方法实现分类号与主题词的自动对应和人工辅助筛选,并设置了模糊转换和精确转换两种分类号与主题词转换的模式。  相似文献   

12.
数字信息资源的自动分类和主题识别--OCLC"蝎子计划"研究   总被引:2,自引:0,他引:2  
“蝎子计划(Scorpion Project)”是美国 OCLC 利用《杜威十进分类法》电子编辑支持系统(ESS)对数字信息资源进行自动分类和主题识别的一个研究项目。本文简要介绍了该项目的进展情况、实施原理,描述了 Scorpion 对数字信息资源进行自动分类和主题识别的具体流程,并将其与我们自行研发的基于《中图法》知识库的中文信息自动标引和自动分类系统进行对比分析,以探讨 Scorpion 对中文信息自动分类和主题识别的借鉴意义。  相似文献   

13.
随着科技迅速发展,网络信息急剧增长,加速分类法更新修订的步伐已经提上日程,成为迫切需要解决的问题。本文通过对《中图法》和《杜威十进分类法》在更新周期和方法上的比较,指出《中图法》存在更新周期长、来源贫乏的问题。针对这一问题,本文提出借鏊国外分类法的优点和长处,对《中图法》的更新另辟佳径,并着重探讨了五种切实可行的来源及方法:①利用分类知识库;②利用最新的文献和网页;③利用文献数据库中的标引关键词;④利用国外分类法及词表的增补公报;⑤利用概念空间。  相似文献   

14.
使用基于《中图法》知识库的中文信息自动标引和自动分类系统,对中文图书进行自动标引与自动分类的实验,以测试该系统对图书的适用性。实验通过对中文图书进行计算机自动标引与自动分类、人工打分测评、测试结果统计分析,得出中文图书的各标引源主题表达能力依次为:书名、内容提要、两级目次、参考文献、一级目次,在此基础上对标引源进行加权设计,权值设为5:3:2:2。实验证明该系统用于中文图书的自动标引与自动分类是可行的。表6。参考文献9。  相似文献   

15.
面对搜索引擎基于关键词全文检索导致检索准确度低和学科信息门户加工描述只到站点级别的问题,作者提出了将搜索引擎和学科信息门户结合构建智能学科门户搜索引擎的建议--在经过学科专家筛选的、学科信息门户目录中的高质量网站中自动收集网页,形成网页索引,利用自动标引与自动分类方法对收集到的网页进行标引和分类,最后通过分类浏览目录与主题词检索的方式,向用户提供学术资源网页的查找.文章重点介绍了智能学科门户搜索引擎的网页采集、网页自动标引与自动分类及用户接口的设计与实现,并对该搜索引擎存在的问题进行了分析和讨论.  相似文献   

16.
《中图法》第四版中"家具制造工业"类目注释与加"0"问题   总被引:1,自引:0,他引:1  
通过分析第四版《中图法》“家具制造工业”分类标引与设类、类目注释,排除了两例号称标引需要加“000”的例证,指出《中图法》相关类目注释的不当,提出改进意见,并且进一步明确“转换复分”与“跨越复分”概念,推出《中图法》加“0”主流规则的初步观点。  相似文献   

17.
刘少武 《中国索引》2006,4(4):46-49
对《中国少年儿童文献分类主题词表》“第一表 分类号-主题词对应表”(亦即《中图法》(儿童馆、中小学馆)第三版)新增补编列的“邓小平部分著作写作年代表”所存在的篇目缺漏和排序不规范等明显疏失问题,进行了增补和订正。  相似文献   

18.
使用《中图法》进行机读数据标引的体会   总被引:4,自引:0,他引:4  
《中图法》用于机读数据标引是通过分类号分析、增加互见分类和分析分类等方法。增强文献分类标引深度,提高文献检全率和检准率。本文主要就如何做互见分类和分析分类谈谈想法和体会。  相似文献   

19.
基于标引经验和机器学习相结合的多层自动分类   总被引:6,自引:0,他引:6  
由于《中国图书馆分类法》类目数目庞大且各类目上文献分布不均衡,导致基于机器统计学习的自动分类技术在这种多层分类体系上力不从心。基于人工标引经验的自动分类试图通过情报检索语言兼容互换的原理解决这一问题,然而直接应用标引词串对分类进行匹配在实际应用中产生了一系列的问题。本文试图通过将两种分类技术相结合的方法对信息资源进行分类,提出了用相关度来测定关键词和类目概念之间的关联,构建关键词、分类器的构建原理、构建方法以及分类流程,并对该方法存在的不足进行了分析。  相似文献   

20.
邓晓辉 《图书馆杂志》2000,19(11):49-51
探讨用《中图法》标引地方文献存在的问题,并对《中图法(第四版)使用手册》进行应用性研究。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号