首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
基于词向量扩展的学术资源语义检索技术   总被引:1,自引:0,他引:1  
[目的/意义] 尝试以统计的方法为指导思想,探究基于词向量扩展的语义检索技术来提升学术资源的语义检索能力。[方法/过程] 利用自然语言处理、文本挖掘技术,对采集来的学术资源(主要是学术论文)元数据进行预处理,结合word2vec词向量生成工具和elasticsearch全文检索引擎搭建语义检索系统,对学术资源进行语义检索的探索研究。[结果/结论] 本文提出的方法能够有效提升学术信息的检索效果,一定程度上实现学术资源的语义检索,并为后续语义检索的进一步研究提供借鉴。  相似文献   

2.
分众分类标签的语义模糊性和标签无序性使得检索效率越来越低,为准确定位标签语义,旨在研究一种新的方法,从主题词表的词间关系判断标签间的语义关系。以《中国分类主题词表》教育类主题词搜索Delicious网站得到的相关标签作为数据源,分析标签与主题词的重叠度,选择《中国分类主题词表》和ERIC在线教育词表作为标签的语义关系抽取工具,认为相关标签集中语义关系较为丰富。  相似文献   

3.
元数据管理理念在医学信息资源领域的应用   总被引:3,自引:0,他引:3  
徐维  管志宇 《中国索引》2005,3(2):33-36
本文旨在通过引入元数据的概念与管理理念,促进对医学资源的发现与利用。首先,元数据能帮助建立医学语义网络,实现医学语义检索。其次,元数据能实现生物医学知识的挖掘。最后,通过元数据能建立医学质量控制主题网关,它有一个描述因特网资源的详细的元数据记录的数据库,并且提供访问资源的超链接。因此,目前国内生物医学信息机构的任务应该是建立生物医学领域的元数据系统,即医学核心元数据集,以此为模板来标引著录任何资源以及组织管理任何资源。  相似文献   

4.
基于社会性书签服务的信息发现行为模式研究   总被引:2,自引:0,他引:2  
针对信息发现行为模式的重要性,基于社会性书签服务和信息导航的相关理论,分析利用社会性书签服务来发现有用信息资源的用户行为,以评估社会性书签服务对信息发现的有效性.分析结果表明,用户经常选择标签搜索焦点主题,并且更喜欢浏览别人的图书馆来查找围绕焦点主题的相关信息,在此基础上对社会性书签导航功能提出改进思路.  相似文献   

5.
数字图书馆的Google之道   总被引:5,自引:0,他引:5  
毛军 《图书情报工作》2005,49(3):136-139
Google正在改变用户查询信息的模式,并同数字图书馆展开竞争。Google与数字图书馆相比,虽在某些功能方面有优势,但数字图书馆仍然有很大的发展空间。图书馆员应学习Google的经验,使用其技术来改善自身服务,包括利用Google开展参考咨询,加强与用户的交流互动;向搜索引擎公开元数据,以提高其使用率和社会效益;出版商协作发展本地集成的信息服务;建立同Google的“竞争合作”关系。  相似文献   

6.
基于知识模型的文本信息检索可视化研究   总被引:5,自引:0,他引:5  
信息检索可视化是指把文献信息、用户提问、各种情报检索模型以及利用检索模型进行信息检索过程中不可见的内部语义关系转换成图形,在一个二维或三维的可视化空间中显示出来,并向用户提供信息检索的技术。基于知识模型的文本信息检索可视化,是利用信息资源的元数据信息来进行可视化检索。图1。参考文献29。  相似文献   

7.
万维网信息网关面临着三大挑战:描述内容的直观的词汇表,词汇表系统的逻辑结构,以及不同的词汇表结构之间丰富的相互关系。本文试图解决美国国家教育图书馆发起的教育资源网关(GEM)遭遇的这些挑战。GEM的面向资源的词汇表定义了教育资源的范围和子类;然而,它缺乏主题类目之间和主题类目与关键词之间的相互关系。对GEM用户所作的一次调查表明,这种语义关联的缺乏对系统的检索效果具有负面的影响。作为对比,许多面向知识的词汇表系统含有语义关联及表达知识的结构。这篇论文报告了GEM语义项目第一阶段的成果,在这一阶段,作者通过分析其结构和特点,对GEM的受控词汇表增加了语义映射。在语义映射实验基础上,提出了两种模型来整合面向资源和知识的词汇表系统。元素-属性-值(EAV)模型注重于资源类型,可以方便地用文献类型定义来表达。语义层级模型则基于主题词条的语义含义和关系来对其加以处理。这两种整合模型可被用作词汇表建立和维护的理论框架。  相似文献   

8.
针对文本聚类分析结果表达中缺乏语义关系的缺陷,本文利用人们在可视化形式下对模型和结构的理解和获取能力,提出了一种新的可视化表达方法。通过改进的Force-directed模型对聚类分析结果进行文本布局,表现文本间的语义相似关系;使用等值线生成算法构建层次性主题图,聚集和提炼文本主题;最终实现文本聚类分析结果的语义直观表达。实验结果表明,这种可视化方法不仅能够有效地表达聚类结果,体现类间、文本间的语义相关程度,而且还有助于发现隐含的信息,并通过类别之间的关联实现有效的信息导航。  相似文献   

9.
VISION:集成分类法、主题词表和语义元数据的概念网络   总被引:19,自引:2,他引:17  
王军 《情报学报》2003,22(4):412-418
本文提出了一种在分类法和主题词表的基础上集成语义元数据、构建概念网络、实现概念检索的方法.和其他的概念检索系统相比,它的最大特色是在检索之前先将信息资源根据其内容和主题组织到概念网络中.这样的概念网络,既是一个资源组织的框架,又是一个知识浏览和概念检索的信息空间.同时,还能支持用户学习.文章介绍了国内外概念检索的研究现状,讨论了集成分类法、主题词表和语义元数据构建概念网络的方法和好处.介绍了一个原型系统VISION,它是在<中国分类主题词表>的基础上,利用北京大学图书馆计算机类的书目数据实现的.文章最后进行深入讨论并介绍下一步的研究工作.  相似文献   

10.
随着虚拟知识环境的发展,知识组织成为虚拟知识环境建设中的热点问题.2007-2008年,虚拟知识环境的知识组织研究主要聚焦于利用分类和主题、元数据、本体和语义关系来构建虚拟知识环境的知识组织体系,力图通过改进和完善知识组织来提高虚拟知识环境中知识的发现和检索能力.  相似文献   

11.
基于机器学习的文本自动分类研究进展   总被引:6,自引:0,他引:6  
张雪英 《情报学报》2006,25(6):730-739
文本自动分类是目前最常用的文本信息自动处理技术,也是机器学习、自然语言处理和信息检索领域的研究热点之一。本文比较全面、深入地论述了基于机器学习的文本自动分类所涉及的相关问题及解决方法,并提出了当前该领域面临的主要研究问题。  相似文献   

12.
微博是Web2.0时代重要的网络服务工具,作为以用户为中心的信息发布、传播和分享平台,它包含了非常丰富的用户信息。在微博中,可以使用标签表示用户的兴趣和属性。而一个用户的兴趣和属性,通常包含在这个用户的文本信息和网络信息中。针对微博用户的标签进行分析,提出网络正则化的标签分发模型(NTDM)来为用户推荐标签。NTDM模型对用户个人简介中的词语和标签之间的关系进行建模,同时利用其社交网络结构作为模型的正则化因子。在真实数据集上的实验表明,NTDM在效果以及效率上都优于其他方法。  相似文献   

13.
介绍本体作为知识工程领域的一种新方法被引入到汉英机器翻译的研究中,用来协助机器翻译中对自然语言语义的理解和计算;指出本体为源语言与目标语言的词汇提供中性化、形式化的表达,其概念语义网络为自然语言的歧义消除提供世界知识、语义空间,本体工具本身所具有的推理功能也使机器翻译的语义处理更为便捷,本体已逐渐成为语义处理的新的理论基础及工具。  相似文献   

14.
用户标注具有简洁、交流与共享、自由表达、推荐与检索等特点,但是它的平面结构使其很难适应语义网的需要,因而有必要进行语义建构,建立用户标注模型和语义联系,以便使用元数据与本体语言对用户标注进行语义描述,使之成为标签本体,以适应新一代因特网的发展。  相似文献   

15.
国外基于大众标注系统的标签研究   总被引:1,自引:0,他引:1  
标签是一种自由形式的关键词元数据。作为一种标题词,它具有直接揭示内容、提供查找功能、表达精炼(多为词或短语)等特点。文章从标签的基本理念,标签的呈现界面,标签的组织对象,包括网页(主要是博客)、音频视频资源等,以及标签与信息检索(检索结果处理、相关度排序、搜索引擎、语义处理)等角度揭示了国外基于大众标注系统的标签的研究进展。  相似文献   

16.
[目的/意义] 为提高标签质量,优化社会标注系统的信息服务提供依据,从用户在社会标注系统中与其他用户交互的视角,探讨不同交互特征用户的标注行为差异。[方法/过程] 以豆瓣读书作为社会标注系统研究样本,从标签数量、标签结构、标签语义、标注动机和活跃度五个角度研究豆瓣用户标注行为的分布特征;使用用户的关注人数、被关注人数和使用年限表征其在社会标注系统中与其他用户的关联和交互程度,通过差异性分析探讨不同交互特征用户标注行为的差异,并通过多元回归分析研究交互特征对这种差异影响的程度。[结果/结论] 实证研究表明,不同交互特征的用户间的社会标注行为存在显著差异:与其他用户交互比较强的用户标签数据集包含更多的标签,关注其他用户越多的用户和被越多用户关注的用户所使用的标签数量越多;使用豆瓣读书年限越长的用户,其平均标签长度和标签重用率越大,而其与其他用户的关注关系对其标签平均长度和标签重用率的影响不大;用户的特殊语种标签比受用户的使用年限影响很大,但一个用户被多少人关注不会显著的影响其特殊语种标签比;关注其他用户越多的用户在标注系统中越活跃。由此可见,社会标注系统可以采取措施加强系统中用户间的交互,通过用户间的相互作用规范用户的社会标注行为,从而提高标签质量。  相似文献   

17.
Minnesota’s Foundations Project is a multiagency collaboration to improve access to environmental and natural resources information. The Project chose the Dublin Core metadata standard for web resources. Three studies were conducted: needs assessment, Bridges web site user interface, and usability of controlled vocabulary in Dublin Core metadata. Based on these findings and information architecture, the Project published best practice guidelines. Controlled vocabulary is important to facilitate access. This is relevant to the third study on Dublin Core metadata, which tested keyword searches of web pages to determine the effectiveness of controlled vocabulary in the Dublin Core subject tag. Central to the Best Practice Guidelines is the User Guide to Dublin Core, which offers an element-by-element understanding of the metadata schema. Current bibliographies and reports show further background work that informed the decision-making process for such important choices as metadata schema, thesaurus and thesaurus management software, search engine, and RDF/XML standards.  相似文献   

18.
This article critically examines four Google search products (Google Advanced Search, Google News Advanced Search, Google Books Advanced Search, and Google Advanced Scholar Search) and shows how each uses metadata to enhance or improve search results. In addition, the article shows how metadata can increase search precision and recall in information discovery systems. From a library perspective, this article analyzes some of the metadata-enabled features of Google's advanced search pages and compares these features to those found in a typical online library catalog. From a serials perspective, Google News Advanced Search demonstrates how Google indexes news websites, sites that are essentially continuing resources. As Google incorporates more and more metadata functionality into its advanced search pages, they increasingly begin to function more like online library catalogs and less like search pages found in a traditional Internet search engine. The simple search box has many limitations, and like libraries, Google is increasingly creating and offering metadata-enabled search features that improve search precision and recall in its products.  相似文献   

19.
鉴于专利术语的翻译要求高度的准确性和专业性,而专利术语的自动获取翻译对于机器翻译、词典自动编纂、跨语言信息检索等自然语言处理具有重要的实用价值,从双语的专利摘要中分别抽取术语,之后融合多术语识别方法,采用规则翻译和统计机器翻译来动态地辅助词汇化方法进行术语对齐,以期尽可能多地在双语的专利文献中获取准确的专利术语翻译对。在专利文摘中进行实验验证的结果是:专利术语翻译对的准确率达到80%。  相似文献   

20.
最新标签本体:标签和民俗分类法语义模型   总被引:3,自引:0,他引:3  
当前,人们越来越关注协作化标签系统中标签数据的表示和共享。传统的标签(指随意标注的、没有与结构化本体相关联的标签)由于语言和语法的差异以及录入错误等,不适于做协作化处理。而且标签反映的是用户个人的观点,也不对同义词、词形变化或者其他对照映射关系做规范处理。因此笔者认为,标签的常规处理方法对语义协作的贡献非常有限,即便是有,要让计算机实现自动共享也是极其困难的。在语义层面上讨论数种协作标签标注的方法,提出一个标签协作标注和设计民俗分类法的概念模型,同时比较已有的标签本体,提出一个评价标准,并参照该标准讨论这些标签本体的优缺点。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号