首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
[目的/意义]了解、分析和识别用户学术搜索时所表达的信息需求是优化查询结果、提高学术搜索引擎用户体验的首要步骤,而用户进行学术搜索时通过查询表达式所表达的用户表意信息需求及潜在信息需求可称之为学术查询意图。本文总结学术查询意图类目体系有助于学术查询意图识别和检索结果页面的呈现。[方法/过程]在A.Broder的查询意图类目体系的基础上,结合百度学术搜索查询日志中查询表达式实例,构建学术查询意图的类目体系。以此为基础,总结不同类别的学术查询意图,并分析不同类别学术查询意图下查询表达式的特点。[结果/结论]学术查询意图主要分为学术文献类、学术实体类、学术探索类、知识问答类和非学术文献类五大类;得出不同类别学术查询意图在学术搜索中的大致比例;给出每类学术查询意图的查询表达式特征、查询情景和查询结果页。  相似文献   

2.
为了能更好地组织南海证据性数据,提高南海疆智库的检索性能,便于科研人员对南海问题展开深入研究,本文融合了中国图书馆分类法的族性检索和分面分类法的特性检索,构建了南海文献分类法,应用BERT预训练模型实现细粒度的多标签南海证据性数据的自动分类,并通过数据库技术将南海证据性数据分为12个面进行组配检索。通过以上方法赋予每一条南海证据性数据唯一的分类号和类名,形式化表示为南海证据性数据的数据分类=证据来源分类+证据的数据体系分类+证据的数据分面分类。从更细粒度的视角,实现数据分类,与粗放式文献载体的分类相比,数据分类更有利于展开数据挖掘,找到数据间潜在的关联关系,发现新的研究视角,是科学研究创新的基础和保障。  相似文献   

3.
陈静  徐波  王甜甜  陆泉 《图书情报工作》2016,60(18):140-148
[目的/意义] 对以图书为代表的多主题长文档进行文档内层次主题分析及组织,为用户提供细粒度的挖掘结果,以帮助用户了解图书主题,并快速理解图书内部主题的结构与联系。[方法/过程] 在利用层次主题模型hLDA及上下文信息构建图书内部主题层次组织模型并进行模型实现的基础上,设计实验对模型进行评估。[结果/结论] 实验结果表明,基于hLDA的图书内部主题层次组织具有更高的查全率和查准率。  相似文献   

4.
网络学术文档细粒度聚合本体构建研究   总被引:2,自引:0,他引:2  
[目的/意义] 旨在探索网络学术文档细粒度聚合本体构建的理论和方法。[方法/过程] 在梳理相关理论与方法的基础上,首先明晰细粒度聚合本体概念的基本类型、粒度特征和定义等基本理论问题,然后以网络环境下图书情报学领域"引文分析"主题语料为数据来源,从概念、属性和关系、实例等方面对细粒度聚合单元本体构建进行逐一探讨,并对本体进行评估和讨论。[结果/结论] 首次提出基于聚合单元知识体系构建细粒度聚合本体的思路与方法,可为基于聚合单元的细粒度组织、检索和导航中知识组织系统工具的构建提供参考。  相似文献   

5.
网络上分布着大量异构系统,如何通过网络为信息用户提供信息资源的有效访问,提高检索效率是数字图书馆建设的一个重要指标。以传统数字图书馆系统面临的问题为基础,探讨语义Web对数字图书馆的支持,在整合社会网络和以语义标注的多媒体资源的基础上,构建一种基于语义Web的数字图书馆模型。本体的引入可以增强语义,分面检索的应用则加强了模型系统的检索效率。仿真实验表明模型是有效的。  相似文献   

6.
挖掘图书评论不仅有助于用户了解图书内容,还可帮助出版社优化营销策略。图书评论摘要能够大幅提升用户获取信息的效率,用户只需简短阅读摘要即可了解评论的重点内容。如何为用户提供简洁、准确的图书评论摘要具有重要研究意义。目前的评论摘要研究多是采用句子抽取式的方法,忽视了评论中细粒度的情感信息。此外,不同的图书评论平台在评论内容方面存在较大的差异,仅基于单一平台的评论构建摘要,用户难以通过评论摘要全面了解图书。本文提出了一种包含属性信息和内容信息的图书评论摘要模型,并设计了基于细粒度评论挖掘的书评摘要方法。实证结果表明,本文提出的评论自动摘要方法,生成的评论摘要能够提供细粒度、多维度的图书评价信息。  相似文献   

7.
沈敏  杨新涯  王楷 《图书情报工作》2015,59(11):143-148
[目的/意义] 针对大数据环境下高校图书馆检索系统的信息超载问题, 提出一种机器学习方法, 为用户提供个性化的偏好检索服务。[方法/过程] 通过提取用户检索行为大数据中的用户特征, 利用监督机器学习方法, 在线学习可随用户偏好同步变化的自适应检索模型, 预测用户对文献的选择概率, 优化检索结果的排序。[结果/结论] 设计出用户偏好检索原型系统, 介绍用户偏好检索系统工作流程, 对比分析系统效果, 并对系统进行客观评价。  相似文献   

8.
王颖  张智雄  孙辉  雷枫 《图书情报工作》2015,59(16):119-128
[目的/意义]构建国史知识检索平台,提高用户获取国史知识的效率,促进国史宣传和教育。[方法/过程]提出基于本体的国史知识检索平台构建思路与总体框架,在构建国史本体知识库的基础上,采用Neo4j数据库作为RDF数据仓储,创建基于Solr的实例索引、三元组索引和词条索引,针对多种检索需求设计实现检索引擎的执行流程、检索式构造方法以及查询处理算法,并为国史知识展示设计可视化实现方式。[结果/结论]构建国史知识检索平台,提供实体检索、查询问答、关联检索、时序检索及语义资源浏览等检索与浏览服务。该平台框架及关键技术实现方案可为面向领域知识的深度检索服务提供重要参考。  相似文献   

9.
数字图书馆数值知识元检索系统设计   总被引:1,自引:0,他引:1  
[目的/意义]为满足数字图书馆用户对数值知识的个性化检索需求,向其提供细粒度的知识服务。[方法/过程]基于对数值知识元的深入分析,提出数字图书馆数值知识元识别、抽取、索引与检索方法,并构建一个面向数值知识元的检索系统。[结果/结论]通过实例分析验证基于数值知识元的细粒度知识服务能够在一定程度上提高检索和利用数值知识的效率和用户满意度。  相似文献   

10.
[目的/意义] 构建基于关联数据的探索式检索系统,充分利用关联数据中隐藏的知识网络,向用户提供发现新知识的机会。[方法/过程] 基于DBpedia电影数据集,采用改进的向量空间模型进行关联数据的语义相似度计算,使用可视化的交互技术对检索结果进行呈现。[结果/结论] 通过基于任务的评价方法与IMDB进行对比,证明基于关联数据的探索式检索系统能够提高检索效率,提升用户体验并能引导用户发现其感兴趣的信息。  相似文献   

11.
本文研究了科技文献副主题词的自动抽取问题,并对其在分面检索中的应用进行了探索。为实现副主题词的自动标引,本文提出了以标题作为抽取数据源、基于规则进行抽取的实现方法,并以图情领域文献进行了实验。结果显示,基于规则的抽取方法在召回率和准确率方面表现良好,均超过了90%;但仅以标题作为抽取数据源会导致召回率偏低,仅有49.9%的文献能抽取出副主题词。为探索副主题词在分面检索中的应用,本文以图情领域文献为例构建了原型系统,从使用效果来,副主题词作为独立的检索点价值不大,但和其他检索点配合使用则可以更贴切地表达用户需求,作为分面则能在帮助用户进行探索式检索以及结果筛选方面发挥重要作用。本研究的局限性包括仅采用标题作为副主题词抽取数据源,导致召回率不高;在副主题词抽取时未考虑同时抽取相应的主题词等。  相似文献   

12.
王晓艳  林昌意 《图书情报工作》2015,59(1):113-118,126
[目的/意义] 通过网页分类提高搜索引擎及内容网站的检索性能,根据查询意图分类更精确地满足用户需求。[方法/过程] 以信息类中文网页为研究对象,采用人工归纳的方法构建信息类查询意图类目体系,提出根据该类目体系对信息类网页进行分类的方法,并通过实验进行验证。[结果/结论] 实验结果表明,所提出的方法具有较强的可行性,有助于精确地满足用户信息需求,提高搜索引擎及内容网站的检索性能。  相似文献   

13.
从分面检索的基本概念与特点出发,对基于集合论、基于轻量级本体、基于形式概念分析的三类分面模型进行分析归纳,对分面分类体系生成、分面排序及搜索结果排序等关键技术的主要研究工作进行综述,并对有代表性分面检索系统进行说明.  相似文献   

14.
[目的/意义] 研究高校图书馆OPAC中引入分面搜索技术给用户带来怎样的搜索体验。[方法/过程] 主要通过对用户在两种界面下(传统列表界面和基于列表与分面的界面)进行两种搜索任务(已知任务和探寻式任务)时所表现出的行为和喜好进行实验与观察,从搜索时间、搜索结果准确度、用户评价3方面对比分析搜索界面、搜索任务对用户搜索体验的影响。[结果/结论] 通过研究发现:相对于传统列表界面,受试者在使用基于列表与分面的界面时,搜索用时更短、用户评价更高。  相似文献   

15.
基于Sogou实验室提供的查询日志数据和新闻数据,探讨潜在时间意图查询的判断及其相关时间属性识别,构建潜在时间意图查询的检索排序模型。实验结果表明,时间属性识别的准确率为85%,且构建的检索模型能有效提高排序效果。  相似文献   

16.
[目的/意义] 探讨用户在公共检索计算机上进行OPAC检索时遭遇失败的原因,为增加用户对系统的使用体验提供对策和建议。[方法/过程] 以国内某大学图书馆OPAC日志数据为例,从数据资源相关、用户相关、系统功能相关3个角度进行编码和分析。[结果/结论] 总结出三大类、19个具体类目的失败原因:首先,用户相关原因为主要原因,主要体现在用户检索策略方面的欠缺;其次是馆藏缺失问题,以文学类图书居多;再次是系统相关原因,主要体现在空格的"与""或"默认处理上。并从OPAC系统改进、用户培训和资源建设方面提出对策和建议。  相似文献   

17.
随着数字化时代的到来,传统的关键词匹配检索方式已经无法满足用户个性化的信息需求。因此,构建用户检索意图库成为了解决这一问题的关键。通过收集和分析用户查询数据和目标数据,分析提取用户意图特征,并作为构建用户检索意图库的基本要素,利用自然语言处理技术理解和识别用户检索意图,同时探析了用户检索意图构建过程中的三大关键技术,探讨了用户检索意图库在公共图书馆中的应用。  相似文献   

18.
针对当前书目检索过程中缺少检索建议与提示而影响检索性能的现状,进行检索建议与提示策略的研究。通过阐述检索行为的概念与属性、分析用户的检索心理,挖掘用户行为数据,并在此基础上实施访问OPAC网站、输入检索词、获得检索结果及选择检索结果等检索过程与行为的引导服务与查询帮助,从而较为准确地判断用户的查询意图,对用户的检索行为给出实时的、丰富的检索建议与提示,以期增强书目检索功能,提高系统的互动性,提升用户的查询体验。  相似文献   

19.
[目的/意义] 构建一个基于多语言本体的跨语言信息检索模型,有助于用户通过该模型使用自己熟悉的语言来获取不同语种的信息资源。[方法/过程] 通过本体设计及检索模型功能模块设计建立一个基于数字出版领域本体的中英跨语言信息检索模型,并利用Java语言及Lucene搜索引擎架构对该模型进行编程实现。[结果/结论] 多语言领域本体具有明确、形式化、共享、概念化、结构清晰等特征,可以作为语义层应用于跨语言信息检索系统之中,实现信息资源的语义表达。经测试,本文构建的模型能够较好地实现分词、查询扩展和语义关联等功能,促进跨语言信息检索向语义层次发展。  相似文献   

20.
[目的/意义]实现学术查询意图的自动识别,提高学术搜索引擎的效率。[方法/过程]结合已有查询意图特征和学术搜索特点,从基本信息、特定关键词、实体和出现频率4个层面对查询表达式进行特征构造,运用Naive Bayes、Logistic回归、SVM、Random Forest四种分类算法进行查询意图自动识别的预实验,计算不同方法的准确率、召回率和F值。提出了一种将Logistic回归算法所预测的识别结果扩展到大规模数据集、提取"关键词类"特征的方法构建学术查询意图识别的深度学习两层分类器。[结果/结论]两层分类器的宏平均F1值为0.651,优于其他算法,能够有效平衡不同学术查询意图的类别准确率与召回率效果。两层分类器在学术探索类的效果最好,F1值为0.783。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号