共查询到20条相似文献,搜索用时 31 毫秒
1.
基于知识库的网页自动标引和自动分类系统的设计 总被引:15,自引:0,他引:15
针对中文网页文本信息特征,提出了信息标引和组织方案,并构建了一个基于知识库的网页自动标引和自动分类系统。中文网页的自动标引和自动分类思想主要基于知识库进行。知识库实际上是一个基于《中图法》的专家知识系统,包括了中图法库、汉表库、分类号主题词对应库、同义词库、关键词库等若干数据库。在确定网页基本信息标引源的基础上,中文网页主题标引运用了基于词频的统计加权法;通过与分类号一主题词对应库主题词串的词面相似度计算,进一步完成中文网页的分类标引。最后还讨论了新词识别等技术问题。 相似文献
2.
对<中文核心期刊要目总览>(2008年版)收录的137种农业核心期刊的分类标引进行了统计,有分类标引的期刊117种.对有分类标引的期刊每刊随机抽取1篇论文对其分类标引结果,(即中图分类号)进行分析表明:分类正确的101篇,错误的16篇,正确率86%,分类级别主要为4~6级.分类标引存在的主要问题是标引错误或印刷错误、重复标引、标引专指度太低和标引不适度. 相似文献
3.
期刊论文的中图分类号对于科研人员有着重要的导航作用,但关于信息素养的期刊论文中图分类号存在过于分散、标引错误、标引不规范的问题,对此提出了解决办法,即根据各自研究的侧重点分别归入G201、G203、G25及其下位类或者在G201类目下直接增加"信息素养入此"的注释。 相似文献
4.
本文依照分类标引的四个质量标准:准确、一致、适度和实用要求,详细评析了中文图书在版编目数据中分类标引存在的各种常见问题,如分类号不够准确、分类标引过于粗略、复分与仿分不准确、分类标引不一致、笔误或印刷错误等引起的分类标引质量不高,最后提出了加快电子在版编目(E—CIP)的进程,提高在版编目数据质量的建议。 相似文献
5.
古籍编目规范化若干问题探讨 总被引:1,自引:0,他引:1
目前,古籍编目工作在分类标引、主题标引、文字使用等方面存在书目数据难以规范的问题.在<中国图书馆分类法>的分类号和<中图分类主题词表>的主题词后各加一个辅助区分号,能够形成适用于古籍编目的分类号和主题词.这种分类号和主题词简单、实用、灵活,便于规范和推广.此外,文字使用的规范化也是编目数据规范的重要内容之一,所以在古籍编目工作中还要准确使用繁简字、异体字、古今字及避讳字. 相似文献
6.
一、分类标引的几个关键问题 分类标引是以分类号描述档案文件主题的过程,它与主题标引有许多不同。本文不谈分类标引的一般理论,只谈标引实践中认为是关键的几个问题。 (-)准确把握主题性质,才能赋予正确的类号。在分类标引中,一个条目一般只赋予一个检索标识。这就要在分类标引的主题分析时,必须对文件或案卷进行宏观的综合分析,准确地确定主题性质,用一个分类号从整体上描述主题。否则,主题性质把握不准,标引的类号也就错了。举例说明。 相似文献
7.
8.
浅谈资料、期刊论文中的中图分类号和参考文献 总被引:1,自引:0,他引:1
本文主要简述了资料、期刊论文中的“中图分类号”和“参考文献”的重要性及它们的分类标引和著录方法,并在简述的过程中对图书、报刊的标引和著录也作了相应的分析。 相似文献
9.
10.
11.
民国档案分类标引是将民国档案主题分析的结果赋予《民国档案分类表》(下简称《分类表》)分类号标识的过程,在标引时必须为充分发挥民国档案的作用创造条件,根据民国档案具体内容和用途,提供必要数量的检索途径,对档案内容涉及两个以上的主题者,依据《分类表》体系类目之间的内在联系,可以标引两个以上的分类号,以增加…… 相似文献
12.
通过对CALLS联合目录“中文书目分类—主题整理项目”中的U大类交通运输类的整理,发现CALIS数据库中存在着主题词标引次序混乱、同一主题的标引不一致、总论复分添加不统一、文献类型主题词局限及标引不可重复、增词原则不严谨和名称主题规范不标准,分类主题标引没有一体化等问题,要一一得以妥善解决,必须严格按照分类主题标引的细则、组配标引模式来进行标引,并建立主题规范记录库,以提高书目数据库的标引质量。 相似文献
13.
14.
15.
1 在自由标引基础上建立数据库 索引体系和分类体系的可行性 自由标引是不依据词表的一种主题标引法,即标引人员在对文献的情报内容进行分析之后,按一定规则自拟标引用词来表达文献主题。就其实质而言,这是一种在文献检索中利用自然语言的方法。对于不要求使用指定词表的数据库,自由标引是一种较好的选择。自由标引尤其适用于报纸文献、期刊文献的综合性数据库的标引,因为这类数据库文献内容庞杂,新概念多,数量大,很难编制适用的词表,而且使用词表标引用工多,速度慢,建库单位实际条件往往不允许。 自由标引的优点在于;(1)虽… 相似文献
16.
17.
略论图书在版编目数据的质量问题及对策 总被引:12,自引:0,他引:12
目前我国的 CIP数据准确率不足 60 %。存在的主要问题是 :著录格式不标准 ,著录项目错误 ,标识符号差错 ;分类标引错分 ,分类标引不一致 ,随意补充分类号 ;主题标引选词不准 ,组配不规范 ,错标、漏标。针对上述问题 ,提出 10条相应对策。参考文献 11。 相似文献
18.
通过分析专题数据库分类标引存在的问题。提出了专题数据库分类标引工作步骤,探讨了论文分类语言的选择、分类标引原则的制定及人员的培训等相关问题,并提出了自己的一点建议。 相似文献
19.
通过具体实例,对图书在版编目数据图书分类号存在的归类不恰当,分类不到位,多卷书、丛书标引不一致,类号错标、漏标等问题进行了分析指正。 相似文献