首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
使用基于《中图法》知识库的中文信息自动标引和自动分类系统,对中文图书进行自动标引与自动分类的实验,以测试该系统对图书的适用性。实验通过对中文图书进行计算机自动标引与自动分类、人工打分测评、测试结果统计分析,得出中文图书的各标引源主题表达能力依次为:书名、内容提要、两级目次、参考文献、一级目次,在此基础上对标引源进行加权设计,权值设为5:3:2:2。实验证明该系统用于中文图书的自动标引与自动分类是可行的。表6。参考文献9。  相似文献   

2.
中文网页标引源主题表达能力的调查统计   总被引:22,自引:1,他引:21  
通过对随机采集的300篇中文经济类网页进行人工自由标引、人工打分、词频统计,并进行统计数据的分析,得出网页内容主题与网页题名、文章标题等12个标引源的关系,分析中文网页的不同部位的主题表达能力,并为之设计加权标引时的适当权值,以便为自动标引及人工智能搜索引擎的研制提供数据。  相似文献   

3.
经济期刊论文的分类标引   总被引:2,自引:0,他引:2  
思维 《图书馆论坛》2003,23(4):98-100
对经济期刊论文进行分类标引。其根据是《中国图书馆分类法》(第4版)。经济期刊论文分类标引要在充分认识其特殊性的基础之上。坚持充分标引、归类恰切、标引适度三个原则。标引工作应按分析主题、判断类别、标引类号三个步骤进行。在处理交替类目、类号组配和交叉学科等问题上。要坚持全部标引、多重式反映。提供尽可能多的检索途径.充分揭示文献蕴含的全部主题。  相似文献   

4.
文章根据期刊论文自身的特点和应用需求,分析期刊论文元素标引的意义,设计期刊论文元素标引规范的制定流程,并深入分析和研究标引规范的内容结构、元素构成及互操作框架,在此基础上提出了期刊论文的核心元数据、文档结构、深度内容三个方面的标引元素,同时指出了下一阶段研究工作的主要方向。  相似文献   

5.
本研究以逸仙时空BBS为舆情信息源,对需要关注的帖子进行情感倾向性分析的探索性研究,设计了主题帖自动标引和情感倾向性分析策略,并对主题帖自动标引结果、倾向性人工判断与自动分析的结果进行对比。  相似文献   

6.
Web概念挖掘中标引源加权方案初探   总被引:15,自引:3,他引:15  
通过对随机采集的1 800篇涉及经济、心理、文学、教育4个学科类别的网页进行人工自由标引、人工打分、词频统计,并进行统计数据的分析,得出网页内容主题与网页题名、文章标题、第一段首句、第一段尾句、第二段首句、第二段尾句、首段、尾段以及HTML标记等12个标引源的关系,分析中文网页的不同部位的主题表达能力,并为之设计加权标引时的适当权值。在我们的Web文本挖掘系统中,进行加权的对比实验表明,此权重方案优于前人的方案。  相似文献   

7.
自动标引研究的回顾与展望*   总被引:3,自引:0,他引:3  
对自动标引的研究进行总结与回顾。对标引对象进行界定;分析自动标引研究的3个阶段,并列出50年研究历程中的代表性方法;详细描述自动标引研究路线图、并对抽词标引与赋词标引方法进行详细分类;最后指出自动标引中存在的问题,并对今后的自动标引研究和应用方向进行展望。  相似文献   

8.
中文全文标引的主题词标引和主题概念标引方法1   总被引:20,自引:3,他引:17  
韩客松  王永成 《情报学报》2001,20(2):212-216
中文全文标引正在越来越受到重视。本文主要研究了三个方面的问题,首先是全文主题词标引的加权问题,综合考虑了五个方面的因素;其次是介绍了一种用层次概念词典改进主题词标引质量的新方法;最后又提出了用三种不同的方法产生主题概念进行全文标引的的主题概念标引。受限范围内的实验结果显示本文的方法有一定的理论和实用价值。  相似文献   

9.
标引人员的智慧与文献标引的质量密切相关。提高标引人员的素养很重要。标引人员需要在标引实践中磨练。自动标引研究已有半个世纪,其标引质量至今未能超过人工标引而取代人工标引,究其原因在于计算机不具备优秀标引人员的智慧,不适应近乎艺术创造的标引作业。可以揣测,没有标引人员介入的、高度自动化的文献标引处理的实现,至少还要等待一个相当长的时间。人工标引研究的成果将有助于自动标引研究中一些难题的解决。不可轻视人工标引的研究。  相似文献   

10.
新中国成立以来,我国的文献标引经历了从分类标引、主题标引到多元化标引的过程,标引方法愈加丰富,标引技术不断进步,逐步由人工标引、机器辅助标引过渡到自动标引,进一步向智能标引方向发展。虽然国内针对文献标引及相关技术的研究较为丰富,但是对文献标引的综述性研究却相对薄弱,无法有效地呈现在现代信息技术驱动下,文献标引领域的发展态势和应用前景。本文在已有研究的基础上,对我国文献标引研究趋势进行分析,提出我国文献标引研究主要呈现两个阶段的发展态势:一是21世纪之前的以传统标引为主体的发展阶段;二是21世纪之后的以自动标引为主体的发展阶段。人工及机器辅助等以传统标引为主体的研究,为自动标引的发展奠定了良好基础,促使自动标引在标引技术、标引系统和标引方法等方面都取得了较为显著的发展,文献标引的应用领域得到更为深入的拓展。但是,文献标引研究更多是在人工智能领域和语言学领域,势必需要图情领域充分发挥自身在文献标引领域研究的理论和实践的优势,再结合其他学科的研究成果,从而使图书馆学传统的文献标引技术符合时代的发展,并产生溢出效应,和其他学科共同发展。  相似文献   

11.
论自动标引的实际应用   总被引:2,自引:0,他引:2  
探讨电子环境下自动标引的特点、标引观念的转变以及影响自动标引的因素等问题。  相似文献   

12.
中文期刊文献通用词标引分析   总被引:1,自引:0,他引:1  
通用因素是文献主题的构成因素之一,对主体因素起细分作用。通用词是指那些在专业领域没有独立检索意义的泛指词。在中文期刊文献标引的过程中,通用词的使用对其标引结果产生着重要的影响。文章讨论了通用词标引的一般规则,并以《中国期刊网》中的文献为例,进行抽样统计和实例分析,归纳了通用词标引的错误现象及其原因,并对期刊文献的通用词标引提出了几点改进意见。  相似文献   

13.
网络环境信息标引的测评与比较研究   总被引:1,自引:1,他引:0  
网络环境下,文献信息具有数量多、增长快、新词层出不穷等特点。标引是对信息资源进行组织的有效手段和重要环节,标引的质量和效率直接影响信息组织的质量和速度。对受控标引、自由标引和自动标引三种标引方式进行了相符度、专指度、标引深度及通用词数的测试对比.得出自由标引优于受控标引,自动标引优于自由标引及受控标引的结论。  相似文献   

14.
基于混合索引的中文全文检索系统研究   总被引:1,自引:0,他引:1  
在中文全文检索系统中引入了混合索引,建立了混合索引之Hash索引,给出了Hash索引在内存中的存储结构,并给出了这种索引下的检索算法。这种索引既能保证索引的全面性,又能提高系统检索效率。通过实际构建系统,探讨了基于混合索引的中文全文检索系统的实现。  相似文献   

15.
针对国内外著名数据库受控标引的标引方式、标引字段的现状和发展趋势进行深入分析,指出目前虽然受控标引以机器辅助标引为主,但自动标引也有成功案例。标引字段除标引文献主题内容外已扩至对文献中的图表、重要数值、化学分子式等进行标引,并采用与分类标引、非受控语言标引相结合的多维度标引模式。最后,基于目前国内外受控标引发展水平的差异,提出国内应从三个方面予以改进。  相似文献   

16.
宋芸芳 《图书馆建设》2012,(3):52-54,57
组配标引是在词表中选择两个及两个以上有形式逻辑关系的词,按照特定规则组成的一组标引词串,用以满足文献多层次、多途径检索的需要。概念组配是文献标引的关键环节。根据参与组配的主题词之间的逻辑关系,概念组配可分为交叉组配、限定组配和联结组配3种基本类型。在实际组配标引工作中,编目员应避免因对新词表不熟悉造成检索词语构成混乱,避免因主题概念转换错误造成粗标、漏标和错标,避免因未遵循专指性标引规则造成切题不当,减少组配标引失误。  相似文献   

17.
为缓解海量文献关键词标引的巨大压力,文章构建了用于海量文献关键词标引的计算机辅助加工系统,对标引数据预处理规范、自动标引核心工作区和人工标引校对平台进行了具体阐述。文章采用数据测试方法确定了自动标引软件,在单一软件不能满足标引要求后探索了多种机标结果后处理方式提升机标质量,最终由人工标引校对平台保证海量文献关键词标引质量的同时,将机标出现的问题和改进意见反馈给软件设计和词表维护,保证了计算机辅助加工系统的持续改进。  相似文献   

18.
索引性能是衡量搜索引擎优劣的一个重要指标。文章通过实验的方法,用TREC-4和WT10g数据集合分别对12种主流开源搜索引擎做了两组索引测试,记录了它们在索引不同大小数据集合时的时间开销和资源消耗情况,并根据实验数据对这些搜索引擎的索引性能进行了比较和评估。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号