共查询到20条相似文献,搜索用时 78 毫秒
1.
基于知识库的网页自动标引和自动分类系统的设计 总被引:15,自引:0,他引:15
针对中文网页文本信息特征,提出了信息标引和组织方案,并构建了一个基于知识库的网页自动标引和自动分类系统。中文网页的自动标引和自动分类思想主要基于知识库进行。知识库实际上是一个基于《中图法》的专家知识系统,包括了中图法库、汉表库、分类号主题词对应库、同义词库、关键词库等若干数据库。在确定网页基本信息标引源的基础上,中文网页主题标引运用了基于词频的统计加权法;通过与分类号一主题词对应库主题词串的词面相似度计算,进一步完成中文网页的分类标引。最后还讨论了新词识别等技术问题。 相似文献
2.
科技期刊论文分类标引的探讨 总被引:13,自引:7,他引:6
讨论分类语言的功能、论文分类标引的意义和选择分类语言的原则.分析我国论文分类标引的现状,对更适用于我国科技期刊论文的分类语言及其标引方法提出了看法和建议. 相似文献
3.
认为中文文献数据库中存在大量的分类号与关键词(或主题词)对应的人工标引记录。通过对这些标引记录信息进行聚合处理,可以实现计算机自动编制分类主题词表。比较两种分类主题词表的编制模式,讨论机编分类主题词表的优势,针对机编分类主题词表已有的成果——知识库的不足之处提出改进方案。改进方案在小规模测试集中取得了良好的效果。最后分析将机编分类主题词表技术应用于新一代《中国分类主题词表》升级改造的良好前景。 相似文献
4.
用于中文信息自动分类的《中图法》知识库的构建 总被引:4,自引:0,他引:4
中文文献数据库中存在着大量的分类号与关键词(或主题词)对应的人工标引记录。通过对这些数据的加工整理,以《中图法》类目体系为主干,组织各学科领域的语词,从而构建出反映分类号与语词概念对应关系的《中图法》知识库,用以实现信息的自动标引和自动分类。构建《中图法》知识库面临着一些难题:异构数据的整合;原始数据中分类号与主题词或词串之间一对多、多对多关系的筛选;标引词串与知识库中的词串的相符性比较等。图2。参考文献8。 相似文献
5.
6.
用于中文信息自动分类的《中图法》知识库的构建 总被引:1,自引:0,他引:1
分类号、主题词、关键词是三种主题概念标识,三者之间存在着概念对应关系,即兼容关系。中文文献数据库中存在着大量的分类号与关键词(或主题词)对应的人工标引记录。通过对这些数据的加工整理,以《中图法》类目体系为主干组织各学科领域的语词,从而构建出反映分类号与语词概念对应关系的《中图法》知识库,用以实现信息的自动标引和自动分类。本文详细讨论了该知识库的构建原理、结构、编制使用的关键技术以及主要应用等。 相似文献
7.
国内外分类主题一体化标引和检索系统研究进展 总被引:5,自引:0,他引:5
本文概述了近十年来国内外分类主题一体化标引和检索系统的研究进展情况 ,并对比分析了国内和国外分类主题一体化标引和检索系统的特点 ,认为建立高度专业化、综合化的超级知识库 ,是建立我国一体化情报检索语言的基础 相似文献
8.
9.
我国期刊论文分类标引问题面面观 总被引:13,自引:5,他引:8
在文献调研的基础上,从历史、理论、方法等方面对我国期刊论文分类标引工作现状进行了分析评价。结果表明,由于我国期刊界对与论文分类标引工作有关的理论准备不足,工作目的不明,掌握语言不准,方法多有不当,因而标引质量较差,致使这项工作在很大程度上流于形式。认为:目前尚不宜将论文的分类标引作为期刊编辑工作的规范性要求;应该给中国期刊编辑学界以足够的理论和方法准备时间;应让各期刊在论文的情报标引(包括主题的和分类的)方面有更大的探索空间和检索语言的选择自由;在目前条件下,应在组织《中图法》分类标引培训提高的基础上,鼓励同时使用UDC标引。 相似文献
10.
通过分析专题数据库分类标引存在的问题。提出了专题数据库分类标引工作步骤,探讨了论文分类语言的选择、分类标引原则的制定及人员的培训等相关问题,并提出了自己的一点建议。 相似文献
11.
图书馆学论文常见问题举要及其成因辨析 总被引:1,自引:1,他引:0
学术论文起首部分存在的主要问题是:论文题目的提炼失准,冗长罗嗦和观点外露,关键词提取出现短语、词组以及通用词。最为普遍的问题是,不重视摘要的事实描述,习惯用定性描述的方法编写摘要,达不到"摘要应包含与论文等同量主要信息"的要求,无法揭示文章的主要内容。论文主体方面存在的主要问题是,引言和结语的缺位或有名无实,最突出的问题是文后参考文献虚列。论文常见逻辑问题是,标题和内容不对称,标题之间的关系不契合。基本训练对论文写作起着基础作用,学术规范对论文写作具有指导意义,从基本结构着眼,从学术规范做起,从基本逻辑入手,是提高学术论文水平的必由之路。 相似文献
12.
藏书工作要体现“读者至上”的思想原则 总被引:12,自引:0,他引:12
图书馆的根本任务是为读者服务。藏书工作是图书馆工作的第一环节 ,理当首先体现“读者至上”思想。藏书工作中的“读者至上”原则体现于藏书收集、图书检索、藏书布局及藏书流通等环节中。此外 ,注意读者阅读倾向 ,及时调整收藏 ,也是藏书工作中“读者至上”思想的体现。参考文献 2。 相似文献
13.
保护读者权利与图书馆事业和谐 总被引:7,自引:1,他引:7
概述保护读者权利的起源和涵义,指出中国图书馆界在保护读者信息、隐私等多种权利方面存在的问题,同时透视问题的负面,提倡读者权利平等,消除信息歧视,促进图书馆事业的和谐。 相似文献
14.
通过网络对我国西部地区省级公共图书馆特色数据库建设情况进行调查,分析西部地区省级公共图书馆特色数据库的类型和特色,指出其存在的问题,提出西部地区省级公共图书馆特色数据库建设的策略。 相似文献
15.
以"佛山市社会经济发展综合数据库"建设为例,阐述基于市情的决策参考特色数据库建设的意义和原则,对数据库建设策略和应注意的问题进行探讨。 相似文献
16.
17.
美国过刊数据库概况及对我国开发过刊数据库的思考 总被引:7,自引:0,他引:7
20世纪末,美国开始出现过刊数据库,例如JSTOR、Wilson公司期刊文献回溯数据库、 MUSE项目及期刊题录索引等。国内目前尚没有1989年之前的过刊回溯数据库。在国内建设 过刊数据库具有减小馆藏压力、挽救过刊、优化服务等重要意义。建设过刊数据库既有不利因 素,也有可操作性。参考文献8。 相似文献
18.
文革资料不同于普通报刊资料,具有-定的特殊性.只有做好它的研究工作,才能为建立文革资料数据库打下良好的基础. 相似文献
19.
20.
档案专题数据库建设热的冷思考——构建基于质量控制理论的档案专题数据库建设流程 总被引:1,自引:0,他引:1
在详尽分析档案专题数据库建设现状及存在问题、简要解读质量控制理论的基础上,提出基于质量控制理论的档案专题数据库建设流程,并着重解析质量控制理论与档案专题数据库建设流程的结合方式。 相似文献