共查询到10条相似文献,搜索用时 15 毫秒
1.
基于知识库的网页自动标引和自动分类系统的设计 总被引:15,自引:0,他引:15
针对中文网页文本信息特征,提出了信息标引和组织方案,并构建了一个基于知识库的网页自动标引和自动分类系统。中文网页的自动标引和自动分类思想主要基于知识库进行。知识库实际上是一个基于《中图法》的专家知识系统,包括了中图法库、汉表库、分类号主题词对应库、同义词库、关键词库等若干数据库。在确定网页基本信息标引源的基础上,中文网页主题标引运用了基于词频的统计加权法;通过与分类号一主题词对应库主题词串的词面相似度计算,进一步完成中文网页的分类标引。最后还讨论了新词识别等技术问题。 相似文献
2.
对<中文核心期刊要目总览>(2008年版)收录的137种农业核心期刊的分类标引进行了统计,有分类标引的期刊117种.对有分类标引的期刊每刊随机抽取1篇论文对其分类标引结果,(即中图分类号)进行分析表明:分类正确的101篇,错误的16篇,正确率86%,分类级别主要为4~6级.分类标引存在的主要问题是标引错误或印刷错误、重复标引、标引专指度太低和标引不适度. 相似文献
3.
本文依照分类标引的四个质量标准:准确、一致、适度和实用要求,详细评析了中文图书在版编目数据中分类标引存在的各种常见问题,如分类号不够准确、分类标引过于粗略、复分与仿分不准确、分类标引不一致、笔误或印刷错误等引起的分类标引质量不高,最后提出了加快电子在版编目(E—CIP)的进程,提高在版编目数据质量的建议。 相似文献
4.
期刊论文的中图分类号对于科研人员有着重要的导航作用,但关于信息素养的期刊论文中图分类号存在过于分散、标引错误、标引不规范的问题,对此提出了解决办法,即根据各自研究的侧重点分别归入G201、G203、G25及其下位类或者在G201类目下直接增加"信息素养入此"的注释。 相似文献
5.
古籍编目规范化若干问题探讨 总被引:1,自引:0,他引:1
目前,古籍编目工作在分类标引、主题标引、文字使用等方面存在书目数据难以规范的问题.在<中国图书馆分类法>的分类号和<中图分类主题词表>的主题词后各加一个辅助区分号,能够形成适用于古籍编目的分类号和主题词.这种分类号和主题词简单、实用、灵活,便于规范和推广.此外,文字使用的规范化也是编目数据规范的重要内容之一,所以在古籍编目工作中还要准确使用繁简字、异体字、古今字及避讳字. 相似文献
6.
一、分类标引的几个关键问题 分类标引是以分类号描述档案文件主题的过程,它与主题标引有许多不同。本文不谈分类标引的一般理论,只谈标引实践中认为是关键的几个问题。 (-)准确把握主题性质,才能赋予正确的类号。在分类标引中,一个条目一般只赋予一个检索标识。这就要在分类标引的主题分析时,必须对文件或案卷进行宏观的综合分析,准确地确定主题性质,用一个分类号从整体上描述主题。否则,主题性质把握不准,标引的类号也就错了。举例说明。 相似文献
7.
8.
浅谈资料、期刊论文中的中图分类号和参考文献 总被引:1,自引:0,他引:1
本文主要简述了资料、期刊论文中的“中图分类号”和“参考文献”的重要性及它们的分类标引和著录方法,并在简述的过程中对图书、报刊的标引和著录也作了相应的分析。 相似文献
9.