首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
LSI潜在语义标引方法在情报检索中的应用   总被引:9,自引:2,他引:7  
介绍了一种基于词相依性的语义结构, 被称为“潜在语义标引”的文献自动标引和检索技术。采用词频统计和奇值分解技术来捕捉文献的语义结构, 得到标引词、提问和文献的向量表示, 检索系统可以预测文献与提问之间的相关度, 达到检索的目的。  相似文献   

2.
本文介绍一种基于句法分析和格式语义结构,被称为“语义矢量空间模式”的文献自动标引/检索技术。在此模式中,自然语言文献和检索提问均表示为语义矩阵。通过计算语义矩阵的相似值,检索系统可以预测文献与给定提问之间的相关度,从而达到检索相关文献的目的。初步试验结果表明,若文献及检索提问较长,特别是以原文献作为提问样本时,此检索技术与康奈尔大学的SMART系统相比,在检全率、检准率和相关排序有效性方面均有所改进  相似文献   

3.
基于领域本体的数字图书馆检索结果动态组织方法研究   总被引:1,自引:1,他引:0  
在对现有数字图书馆检索结果的组织方法进行分析的基础上,从忠实于用户提问的角度,提出基于领域本体的检索结果动态组织方法。基本解决思路是将文献的标识与用户的提问进行有效地对接,即以用户提问为基础构造提问模型,并基于检索结果构造标识模型,将提问模型与标识模型在语义层面通过领域本体进行映射,从而实现文献标识与用户提问在语义层面的互通,最终以用户提问的语义方式来展现检索结果。  相似文献   

4.
王梅 《中国索引》2005,3(4):40-43
索引系统主要研究信息的表示、存储、组织和访问。索引主要是标引信息资源外表特征和内容特征,建立相关参见,形成相应索引数据库,基于索引词匹配的查询,通过布尔逻辑模型、模糊逻辑模型、向量空间模型或者概率模型来提高查准率。由于索引词匹配技术很难解决一词多义的现象,相关参照很难解决不确定的相关关系,往往会检索大量的无关信息。近年来,为了提高索引的利用率,索引系统利用语义技术、超链技术、语义网检索技术和知识处理技术,促进索引系统向更高层次发展。本文主要以索引语义为主线,讨论索引语义扩展的方法和技术,结合信息资源管理系统的应用,探讨索引语义功能的实现。  相似文献   

5.
档案管理现代化热点扫描马绪超一、自动标引技术与档案管理现代化自动标引技术是根据拟存储、检索文献(题名、文摘、正文),由计算机自动选定标识词(即检索标识)的标引技术。是1957—1958年由美国的卢恩提出来的,当时主要是基于词频统计法的自动抽词标引,后...  相似文献   

6.
为解决传统关键词检索技术的不足,人民出版社采用最新的语义检索技术,建立面向政治理论文献的语义模型,开发知识点标引平台来提取和整理文献中的各个知识点,将复杂的理论文献知识化、条理化,在此基础上建立多种语义检索模型,实现检索结果的去粗取精、去伪存真。最终实现的人民金典语义检索系统,已经在"人民出版社"网站经过一年多时间的运行,证明其知识点检索的语义准确率和有效率均达到了70%以上,其中"人民金典语义查询"系统的准确率达到95%以上。  相似文献   

7.
中文图书机读书目数据中"610"字段初探   总被引:1,自引:0,他引:1  
在中文文献的主题标引中,非控制词(自由词)标引是一种重要的标引技术。其目的主要在于提高文献的检索效率,扩大文献的检索途径。它是对主题标引的补充和辅助,可弥补主题标引的不足。在其标引过程中,要遵循一定的原则和方法。  相似文献   

8.
采用提问式融合与相关反馈方法的结合,对现有的TopN文献选取策略研究和分析,提出利用相关度系数选取数量可变的TopN文献进行扩展查询的提问融合算法,即基于可变N反馈的提问融合算法。通过实验对固定N和可变N算法进行对比分析,结果显示可变N反馈在一定程度上可以改进检索性能。  相似文献   

9.
现有的主题标引方法一般只能抽取文本中出现的词汇,无法从几万或数十万主题词中选择语义关联强且未出现的词汇;基于机器学习的多标签分类算法则需要每一个标签下有训练数据,限制了它们在主题标引上的应用。面向大规模主题词在海量文献上的标引需求,提出一个基于分布式词向量的混合型自动标引方法,利用大规模语料训练的词向量生成同维度的主题词表示向量和文本表示向量,实现主题词与文本语义相似度的计算。基于大规模语料构建主题词与普通词的映射表,使文本向量只和少量的语义强相关主题词向量比较,大大减少了计算量,提高了标引效率。开发的自动标引工具对近亿篇文献进行了主题标引,达到了较高的速度。与结巴关键词的实验对比结果显示,本文方法抽取的主题词与作者关键词重合度较低,且在去除结巴关键词中的非主题词后,取得了比结巴关键词更高的标引准确率;与人工标引的实验对比结果显示,随着人工标引词数量的增加,本文方法的效果、结果与人工标引结果的一致性在不断增加。  相似文献   

10.
相关反馈是一种根据用户或系统的相关性判断重构初始检索提问的方法,已被证明可以有效地改进检索效果.具体到学术文献,其引用关系表征了文献内容上的相关性,因而可以为相关反馈提供有价值的辅助信息.本文提出了一种基于引用上下文、文献同被引和文献耦合的相关反馈改进算法.该算法的基本思想包括:利用学术文献的引用上下文信息扩充词包模型(bags of words)进行文本表示;在相关文献判断阶段利用相关文献在引文网络中与其他文献的同被引强度和耦合强度扩充相关文献集合;结合基于聚类的相关反馈思想抽取查询扩展项.实验证明该算法提高了相关反馈效果.此外,相关分析的结果表明文献同被引以及文献耦合强度与文献内容相似度具有显著的相关性.  相似文献   

11.
瞿辉  周磊 《图书馆建设》2016,(4):47-51,57
以主题关联为基础的多维语义标引方法可用于馆藏数字资源管理与导航,即通过构建馆藏数字资源多维语义标引体系来对不同数字资源知识对象间的语义关联进行标引,进而实现以内容主题关联为核心的馆藏数字资源组织与多维展示。与传统数据库检索相比,该方法更加准确、直观和有效,可以作为一种知识发现工具和技术应用于中小型机构知识库建设。  相似文献   

12.
中文期刊文献通用词标引分析   总被引:1,自引:0,他引:1  
通用因素是文献主题的构成因素之一,对主体因素起细分作用。通用词是指那些在专业领域没有独立检索意义的泛指词。在中文期刊文献标引的过程中,通用词的使用对其标引结果产生着重要的影响。文章讨论了通用词标引的一般规则,并以《中国期刊网》中的文献为例,进行抽样统计和实例分析,归纳了通用词标引的错误现象及其原因,并对期刊文献的通用词标引提出了几点改进意见。  相似文献   

13.
相关反馈是近年来信息检索领域的研究热点,是自动查询扩展中的一种重要形式,相关反馈主要包括检索词加权和检索词选择。本文介绍了在相关反馈技术中经典的检索词排序算法,对它们带来的性能改进做了比较,并提出了相关反馈的实际应用中需要解决的一些问题。  相似文献   

14.
[目的/意义] 论文摘要是信息组织的重要标引对象,将论文摘要按一定结构进行标引有利于科学传播、知识发现和情报分析。如何对现有非结构式摘要进行精准快速的自动标引是亟待解决的现实问题。[方法/过程] 假定不同类别的摘要具有内在一致性,即对结构式摘要的研究可为非结构式摘要自动标引提供方法和技术参考。据此,基于美国国家医学图书馆结构要素标签术语集和标签分类映射关系,提出结构要素BOMRC体系和结构式摘要的识别与规范化标引方法。其次选取研究样本并采用文本挖掘方法对样本语料中的单词、动词、三词词块、四词词块等词汇进行词频、TFIDF值等多个指标的定量统计分析,构建能够进行结构要素识别的语义特征词典。最后利用非结构式摘要测试集进行语义特征词典有效性检验。[结果/结论] 结果显示,利用语义特征词典方法能够有效识别非结构式摘要的各类要素,并可用于优化以机器学习方法为核心的自动识别模型。  相似文献   

15.
文章介绍了利用汉语科技词系统的词表及词间关系对中文专利文献进行主题标引的研究进展,根据专利文献的特点设计了相应的标引策略和流程,并进行实验及结果分析,证明了本标引方案的有效性,最后对标引结果在专利检索中的应用特色进行了介绍。  相似文献   

16.
选取中国知网(CNKI)的相关数据库作为检索数据来源,以2005—2010年间图书馆情报学领域所发表的关于语义网研究的相关论文作为分析数据,采用词频统计和共词分析的方法对文献中的高频关键词进行分析,概括出国内图书情报学领域语义网研究的五大热点:基于分类法的网络信息组织、基于语义与网格技术的情报检索、语义网的关键技术、网络智能检索与语义相似度、基于领域本体的知识组织。  相似文献   

17.
本文提出了一种新的基于相关反馈的跨语言信息检索查询翻译优化技术,就实现该技术的关键步骤"估计检索词在相关文献集合中的翻译概率"设计了4种不同的算法,并通过伪相关反馈实验比较了这4种算法,验证了查询翻译优化技术的有效性.实验结果显示,4种翻译优化算法都能够提高检索结果的精度,其中基于词对齐的翻译算法相对更优越.此外,查询式的长度和检索主题的特征对不同查询翻译优化算法产生着不同程度的影响.  相似文献   

18.
自动构造布尔检索提问式算法研究   总被引:6,自引:0,他引:6  
本文分析和评价了自动构造布尔检索提问式的两种典型算法,在此基础上提出了一种新的算法──基于样本文献提问构造布尔检索提问式算法。核算法以样本文献提问为基础计算检索词的权重,根据检索词权重值的分布规律来构造布尔检索提问式。此算法的主要目的是简化用户在检索中与情报检索系统的交互过程,从而提高检索效率。笔者利用AUBO检索系统对算法进行了验证。结果表明、,该算法在相同的查全水平上的查准率普遍高于手编提问式的检索结果。  相似文献   

19.
易唐唐 《信息系统工程》2014,(5):134+141-134
现阶段,以图像内容为基础的图像检索的效率还是较低的,如何通过对图像的纹理、颜色和空间特征进行提取和分析,整合得出语义特征,实现对图像数据库的检索,已经成为了图像检索研究中的热门话题。本文将对相关反馈技术在图像内容及语义检索中的应用进行阐述。  相似文献   

20.
文献标引是计算机检索的重要内容之一,是实现图书情报检索自动化的先决条件。所谓文献标引系指从文献正文或摘要中找出能够表征文献主题内容,具有实际意义的词来标引文献资料,以供计算机检索使用。一、标引的重要性在计算机检  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号