首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 140 毫秒
1.
[目的/意义]科技论文是学术界传递和交流知识的重要方式。科技论文评审是对科技论文承载的知识的价值衡量,高效准确的科技论文评审分类预测可以快速判断论文价值,加速有价值的知识传播进程。[方法/过程]本文讨论开放同行评审中自动评审分类方法,利用科技论文语义信息和开放同行评审中的专家评分,分别构建基于传统机器学习和基于深度学习的科技论文文本表示及分类模型,提供自动评审分类结果。[结果/结论]实验结果表明,融合语义信息和评分信息的评审分类模型比单纯依靠评分均值进行评审判断更为有效,以评分+均值为评分信息输入、基于SCIBERT的质量评审分类模型准确率最高,达到90.17%。本文提出的自动评审分类方法具有可用性,准确率较高,可以辅助期刊编辑快速筛选有潜力的科技论文,促进科技论文智能评审的发展。  相似文献   

2.
[目的/意义]基于文本挖掘技术自动发现更具代表性的文献内容主题词,通过定位主题词在章节中的具体位置,并基于可视化技术进行主题标引,帮助读者直观高效发现文献主题间的潜在关系。[方法/过程]基于文本挖掘技术深入文献内容层挖掘主题词,并利用可视化工具直观呈现所获信息,在此基础上尝试构建可视化主题自动标引系统,并在格萨尔领域的多个主题中对该系统的自动标引效果进行验证。[结果/结论]研究结果显示,该标引方法在格萨尔领域实现了文献内容级的可视化主题自动标引,快速精准地定位到章节、段落和句子。标引相关信息获取过程直观可视,并且具有交互性,可提升用户体验和参与度。文章以《英雄格萨尔》为例完成系统验证,但该标引方法技术本身无领域限定,可应用于其他领域的文献。  相似文献   

3.
李纲  徐健  余辉  马亚雪 《现代情报》2017,37(9):171-176
[目的/意义]基于被引片段识别的科技文摘生成是文献计量学、信息检索和自然语言处理等领域共同关注的研究问题。通过梳理相关成果,可为后续研究提供借鉴。[方法/过程]本文首先介绍被引片段概念,进而从被引片段识别与分类、文摘生成与评价等步骤对相关研究进行综述。[结果/结论]当前被引片段识别总体上可以分为机器学习和检索两类,分面判定还存在标准不一致的问题,摘要生成与评估方法相关研究较欠缺。  相似文献   

4.
唐晓波  翟夏普 《情报科学》2019,37(4):97-102
【目的/意义】如何识别文本中的知识片段进行标引,使检索系统能检索文本知识内容是提高用户信息利 用效率的关键。【方法/过程】在文献调查的基础上,文章基于本体概念模型和Word2Vec词向量模型阐述了文本片 段语义标引的流程框架,并对本体语义扩展、神经网络模型训练、文本片段标引、文本片段权重获取四个部分的关 键环节及技术做了详细说明。最后通过实验验证了该流程框架。【结果/结论】实验结果显示该方法在文本知识片 段识别上是有效的,知识识别的准确率达到80%,能够实现对文本知识内容进行标引。该方法为自动化实现基于知 识的文本信息组织提供了有益的参考。  相似文献   

5.
[目的/意义]为满足用户多层次、多粒度的知识获取需求,图书馆文献资源组织的对象由文献单元逐步向知识单元转变。[方法/过程]文章在研究单元信息概念和表示模型的基础上,提出基于本体和关联数据的单元信息知识组织框架,并深入探讨了实现单元信息语义组织的核心步骤。以中医养生领域为例,阐述单元信息知识组织语义模型的应用过程。[结果/结论]本文构建的单元信息知识组织模式,是实现单元信息细粒度组织、语义化揭示以及多维度关联的有效途径。该研究可为特定领域单元信息的语义应用提供参考。  相似文献   

6.
刘爱琴  安婷 《现代情报》2019,39(8):52-58
[目的/意义]面向非相关文献的知识关联能够促进新知识的产生,为科学研究提供了一种有效的辅助手段。[方法/过程]本文以《中国分类主题词表》为主题词受控词表,首先对文献摘要进行中文分词处理并提取主题词,利用计量分析技术和聚类技术分析文献间特征的相似、相异水平,然后基于该系统为用户检索并利用用TOP-K算法反馈用户精确结果。[结果/结论]设计了面向非相关文献的知识关联检索系统,从更细的粒度层面揭示文献之间的知识关联,为用户提供高质量的服务。  相似文献   

7.
[目的/意义] 引文情感分析揭示施引文献对被引文献的褒义、贬义和中性的情感倾向性,解析文献之间深层语义关系,能够帮助更加准确地评价被引文献和作者。[方法/过程] 以自然语言处理领域文献的引文情感为数据集,利用引文中情感表达的引文标识位置指引和情感词汇等特征,采用支持向量机(SVM)构建引文情感的自动识别系统,探索生成更大规模数据的方法。[结果/结论] 实践应用证明,该系统特征的区分度较强,准确率达到93.4%,识别效果较好。引文情感的自动识别系统实用价值较强,拓宽了引文网络分析的研究方法和内容,能够完善论文评价体系。  相似文献   

8.
通过对发达国家科技发展战略、顶尖咨询机构权威报告、我国重点科技项目布局方向的共词分析遴选出高频词,通过高频词确定未来产业领域,并从江苏基础角度建立遴选指标,遴选适合江苏发展的未来产业.以人工智能产业为例,基于2010-2019年Web of Science核心合集收录的英文文献和CNKI数据库的中文核心文献,运用知识图谱方法进行前沿热点技术分析,为江苏下一步发展人工智能产业提供借鉴.结果 显示,江苏未来应加强在医疗、教育等领域的布局,加强对模糊控制、遗传算法、自然语言处理、深度学习等算法的研究.  相似文献   

9.
一种基于本体的语义标引方法   总被引:4,自引:0,他引:4  
传统的采用主题词和关键词对文档进行标引的方法,由于不能提供语义推理而越来越不适合目前的网络环境。由于本体具有良好的概念层次结构和对逻辑推理的支持,在信息检索领域将有很大的应用价值。本文首先介绍本体的基本概念和领域本体的组成部分,然后提出了一种基于领域本体的语义标引方法,采用本体中的概念对文档进行语义层面的标引,为检索的智能推理提供基础。  相似文献   

10.
伍涛 《情报探索》2022,(3):123-128
[目的/意义]旨在提升数字图书馆个性化推荐系统的服务能力.[方法/过程]以图书馆个性化推荐服务为主要研究对象,以读者知识与情感需求分析为引擎,基于富语义技术实现对个性化推荐服务系统的构建,从需求分析、数据收集、读者交互、语义检索、语义分析等方面实现数字图书馆的个性化推荐服务体系架构.[结果/结论]基于富语义的个性推荐系...  相似文献   

11.
12.
[目的/意义]大数据环境下学术创新力自动测度需要建立在相关学术评价指标和学科知识体系基础上,基于领域知识的本体构建将为学术创新力的自动测度提供基础支持。[方法/过程]用手工方式构建学术创新力概念本体,复用《中国分类主题词表》半自动化构建学术创新力评价知识资源的初始本体,加入CNKI期刊题录数据的高频关键词以丰富本体的知识。然后进行学术创新力概念本体和学术创新力评价知识资源本体的实例化。[结果/结论]以G3类题录数据为例,共建立了30 097个概念、41 484个实例以及320 609条关系,基本完成任务目标。  相似文献   

13.
张娟  王向辉  付然  孙晓琳 《现代情报》2017,37(10):49-52
[目的]为了实现海量数据中信息的知识组织,促进单元信息和文献信息内容的知识关联和知识发现,构建单元信息知识组织体系;[方法]以养生领域内的领域本体、文献信息等知识资源为基础,构建养生单元信息知识服务系统;[结果/结论]"养生单元信息知识服务系统"(以下简称"养生知识服务平台")是单元信息知识组织体系建设的重要应用示范,提供语义检索、知识浏览、知识推理和知识发现等服务,实现大数据环境下"单元信息知识组织体系"的有效利用;[局限]文献资源的单元信息抽取及分析涉及人工智能、计算机处理等相关技术,技术实现有较大难度。  相似文献   

14.
[目的/意义]近年来,科技文献资源呈爆炸性增长,海量科技文献中依旧存在大量非结构化摘要。非结构化摘要一方面不利于学者阅读与理解;另一方面不利于对摘要内部信息进行知识的自动化抽取和相应的检索。研究科技文献非结构化摘要的知识表示模型及其自动化抽取方法,对学者快速阅读和机器自动化处理具有重要意义。[方法/过程]文章在分析科技文献非结构化摘要结构的基础上,结合知识元本体理论,构建了一个面向科技文献非结构化摘要的知识元本体模型。通过分析非结构化摘要的写作特征,将文本按句子级划分为目的、方法、结果或结论三个要素,统计每个要素句中的线索词、句型和位置,建立相关规则库,根据本体模型和规则库构建相关抽取算法。最后,下载《计算机技术与发展》中的部分文献进行实验。[结果/结论]通过增加句型集和线索词集,完善了非结构化摘要的要素,构建了非结构化摘要知识元本体模型。实验结果表明,根据本文提出的模型能有效地对非结构化摘要中的知识元进行抽取。[局限]实验的不足之处是需要人工对摘要中的句型和线索词进行归纳总结。  相似文献   

15.
[目的/意义]区别于文献资源集合,网络音频资源集合的组织具有更强的个性化特征,其用户偏好的揭示不仅可拓展数字资源集合组织行为规律,亦有助于网络音频资源服务水平的提升。[方法/过程]选择代表性网络音频资源分享平台中的用户自组织音频资源集合作为样本,通过对音频资源集合名称的高频热词分析,探究用户创建网络音频资源集合逻辑与组织偏好。[结果/结论]相较于文献资源集合组织中对文献资源类型、学科领域等的强调,用户在创建网络音频资源集合时具有优先情感表达(内部归因),其次进行风格、主题、语种描述(外部归因)的组织规律和行为偏好。  相似文献   

16.
[目的/意义]针对技术功效图构建过程中的主要问题和薄弱环节,提出了一种基于SAO结构和词向量的专利技术功效图构建方法。[方法/过程]利用Python程序获取专利摘要中的SAO结构,从中识别技术词和功效词;结合领域词典与专利领域语料库,运用Word2Vec和WordNet计算词语间的语义相似度;利用基于网络关系的主题聚类算法实现主题的自动标引;采用基于SAO结构的共现关系构建技术功效矩阵。[结果/结论]实现了基于SAO结构和词向量的技术功效图自动构建,该构建方法提高了构建技术功效主题的合理性和专利分类标注的准确性,为技术功效图的自动化构建提供新的思路。  相似文献   

17.
[目的/意义]探索基于知识图谱的网络社区学术资源深度聚合的理论和方法,为网络学术社区知识细粒度组织、知识服务实践提供思路引导和新视角。[方法/过程]首先梳理了知识图谱和学术资源聚合的研究进展,从价值需求主体的角度剖析网络社区学术资源聚合的应用价值;然后明确网络社区学术知识图谱的构建流程,构建出基于知识图谱的网络社区学术资源深度聚合框架,并介绍知识富关联关系提取方法;最后设计个体用户画像、语义智能检索、分面式导航三种应用模式。[结果/结论]知识图谱能够较好地应用于学术资源深度聚合,支持网络社区的高级知识服务应用,基于知识图谱的网络社区学术资源深度聚合框架对学术类网络社区平台优化资源配置、有效知识创新服务具有重要参考价值。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号