共查询到17条相似文献,搜索用时 140 毫秒
1.
用于中文信息自动分类的《中图法》知识库的构建 总被引:1,自引:0,他引:1
分类号、主题词、关键词是三种主题概念标识,三者之间存在着概念对应关系,即兼容关系。中文文献数据库中存在着大量的分类号与关键词(或主题词)对应的人工标引记录。通过对这些数据的加工整理,以《中图法》类目体系为主干组织各学科领域的语词,从而构建出反映分类号与语词概念对应关系的《中图法》知识库,用以实现信息的自动标引和自动分类。本文详细讨论了该知识库的构建原理、结构、编制使用的关键技术以及主要应用等。 相似文献
2.
用于中文信息自动分类的《中图法》知识库的构建 总被引:4,自引:0,他引:4
中文文献数据库中存在着大量的分类号与关键词(或主题词)对应的人工标引记录。通过对这些数据的加工整理,以《中图法》类目体系为主干,组织各学科领域的语词,从而构建出反映分类号与语词概念对应关系的《中图法》知识库,用以实现信息的自动标引和自动分类。构建《中图法》知识库面临着一些难题:异构数据的整合;原始数据中分类号与主题词或词串之间一对多、多对多关系的筛选;标引词串与知识库中的词串的相符性比较等。图2。参考文献8。 相似文献
3.
认为中文文献数据库中存在大量的分类号与关键词(或主题词)对应的人工标引记录。通过对这些标引记录信息进行聚合处理,可以实现计算机自动编制分类主题词表。比较两种分类主题词表的编制模式,讨论机编分类主题词表的优势,针对机编分类主题词表已有的成果——知识库的不足之处提出改进方案。改进方案在小规模测试集中取得了良好的效果。最后分析将机编分类主题词表技术应用于新一代《中国分类主题词表》升级改造的良好前景。 相似文献
4.
5.
基于多词表的自动标引技术研究——新华社新闻稿自动标引的实验 总被引:9,自引:0,他引:9
避开汉语分词中的技术特点 ,转向基于多词表自动标引抽词研究是当前中文信息自动主题与分类标引可以采取的一种策略 ,也是最为可行的方法。本文以新华社新闻稿中的题名和导语为对象 ,详细介绍了基于多词表自动标引技术中的词表构建、自动抽词、主题标引和自动分类等技术。并成功设计了新闻信息自动标引的实验系统 ,取得了较好的效果。 相似文献
6.
中文信息自动分类用知识库的设计与构建 总被引:11,自引:2,他引:9
在计算机智能处理技术远未成熟的情况下 ,基于概念语义网络的自动分类采用知识库技术 ,仍将是一种实用的选择。本项研究根据分类语言、主题语言、自然语言三者兼容互换的原理 ,以众多标引员的主题标引和分类标引的经验 ,即文献数据库实体中大量存在的文献分类号和主题词双重标引数据为基础 ,建立一个以《中图法》为基础的的分类知识库———分类法与主题词表对照数据库。论文对构建分类知识库的思路、步骤及主要技术 ,包括关联度测度方案、标引词模式匹配、新词增补等进行了讨论 相似文献
7.
学科门户智能搜索引擎的设计与构建——农业史门户搜索引擎的实验 总被引:1,自引:0,他引:1
面对搜索引擎基于关键词全文检索导致检索准确度低和学科信息门户加工描述只到站点级别的问题,作者提出了将搜索引擎和学科信息门户结合构建智能学科门户搜索引擎的建议--在经过学科专家筛选的、学科信息门户目录中的高质量网站中自动收集网页,形成网页索引,利用自动标引与自动分类方法对收集到的网页进行标引和分类,最后通过分类浏览目录与主题词检索的方式,向用户提供学术资源网页的查找.文章重点介绍了智能学科门户搜索引擎的网页采集、网页自动标引与自动分类及用户接口的设计与实现,并对该搜索引擎存在的问题进行了分析和讨论. 相似文献
8.
9.
基于语料和基于标引经验的自动分类模式比较 总被引:1,自引:0,他引:1
以传统文献分类体系为框架,构建知识库或分类器来实现信息的自动分类是信息加工自动化的一个发展方向。这种自动分类系统一般有两种模式:基于训练语料和基于人工标引经验。我实验室分别在这两种模式的基础上设计开发了两个不同的自动分类系统。本文将详细介绍这两个自动分类系统的结构、设计及其构建,然后分别从原理、知识库构建、分类算法等方面对这两者进行比较分析。 相似文献
10.
11.
12.
河北机电学院图书馆主题法研讨组 《中国图书馆学报》1992,18(2)
The abbreviation of Chinese sentence-mode subject indexing is the "sentence-mode method" -a new method for Chinese scientific and technical document subject indexing retrieval. The Chinese sentence-mode being a form of the retrieval language, is compatible with some characteristics of subject indexing and classification. The article also makes an approach to a new may for the standardization of mark unit. In each particular subject, there exists objectively a kind of "concept unit" which one may follow to use.The 'concept unit'is not like the unit word of the basic word method,nor is it like the subject word derived from a thesaurus artificially standardized.It is an objective,intrinsic concept unit separated out from a particular subject,i.e.a kind of standard subject word of a special form without a thesaurus.The method has already been retrieved and tested by a computer.1 table. 相似文献
13.
施利军 《现代图书情报技术》1992,8(4):42-45
本文介绍了用.数据库管理系统FOXBASE编写的自动标引系统,其中主要介绍的基本思想、实现过程及其特点。文中着重介绍了词标引、主题标引、赋词标引和抽调标引的方法,和在Compaq386机上建立的试验系统。 相似文献
14.
王瑞英 《图书馆工作与研究》2011,(5):74-77
《中国分类主题词表》Web版人物主题词在注释、分类、中国人名英文拼写等方面存在着一系列问题。有鉴于此,本文依据相关文献,就自己的理解,谈了一点看法和改进建议。 相似文献
15.
组织专家的检索系统设计与实现 总被引:3,自引:0,他引:3
组织专家的检索是当前垂直信息检索研究的热门领域,也是组织信息检索研究的重要内容。本文总结了目前国内外组织专家的检索研究现状,分析了构建组织专家的检索系统的需求和挑战,采用基于相关文档集的归并排序法,利用组织内外的网页和期刊数据库等信息智能识别专家的专长,并基于此设计了从数据资源采集、规整、索引、检索到可视化等整个过程的组织专家的检索系统模型及以武汉大学为例的检索系统平台。 相似文献
16.
17.
基于分类标注语料库的关键词标引知识自动获取 总被引:1,自引:0,他引:1
基于大规模层级分类语料库,抽取网页上专家已经标引的关键词形成关键词表;针对关键词的领域不均匀性和邻界域两个特征,提出并模拟计算了关键词表征文本主题特征程度的主题度。以关键词及其主题度为领域知识,结合统计方法,完成了一个知识与统计相结合的关键词自动标引系统。 相似文献