首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 156 毫秒
1.
[目的/意义]以学术论文代表作遴选和评价为目的,探索论文创新性定量测度方法,为代表作评价提供定量数据和客观证据。[方法/过程]对创新概念进行解构,将创新测度指标分为差异度和收益度;使用引用句更客观、丰富地表征文献内容和创新点;将词频统计与词向量相结合,将文本内容与引文网络相结合,提出一种面向代表作评价的学术论文创新性定量测度方法。[结果/结论]对2018年诺贝尔生理学奖获奖论文及其相关论文进行比对实验。结果表明,与被引频次、仅基于文本内容和仅基于引用网络的创新性测度方法相比,该方法更加合理有效,能够更好地适应学术论文代表作的创新性测度要求。  相似文献   

2.
[目的/意义]在阅读文献的过程中,研究流程是研究者需要特别关注的一个重要方面,自动识别学术文本中描述研究流程的段落对辅助文献阅读、学习研究设计等有着重要意义。[方法/过程]文章以自然语言处理领域为例,收集代表性会议论文构建数据集。分别基于传统机器学习模型、神经网络分类工具以及预训练语言模型构建分类器识别研究流程段落,然后对不同模型的分类效果进行评估,确定性能最优的模型。为进一步提升研究流程段落识别效果,在最优模型的基础上,基于ChatGPT进行了数据增强。[结果/结论]实验结果表明,在所有分类器中,SciBERT具有最好的研究流程段落识别效果。基于ChatGPT的数据增强可使SciBERT模型的分类性能进一步提高,最终准确率(Acc)和F1值分别达到了0.9414和0.9409。  相似文献   

3.
[目的/意义]技术路径识别能够得到表征技术发展的链接模式,挖掘技术方向及演变特征,对企业知悉技术路径发展有重要参考价值。[方法/过程]通过Web of Science和USPTO数据库对期刊文献和专利数据进行导出,利用Pajek软件分别构建期刊文献和专利引文网络;对引文网络进行社群划分,提取最大的社群网络进行主路径识别;对双源主路径节点文献构建文本相似性矩阵,利用文本相似性算法将前述路径进行融合与连接,全面揭示技术发展路径。[结果/结论]提出了一种基于期刊文献与专利双源引文网络和文本相似性分析的技术路径识别及融合方法,将该方法应用于无线充电技术领域,揭示了无线充电技术的发展主线,验证了所提方法的可行性与实用性,为相关企业明晰技术路径提供了科学的决策理论支持。  相似文献   

4.
[目的/意义]网络新闻是获取突发事件情报的重要来源之一,提高海量网络新闻中突发事件的识别准确率和分类效果,并减少非突发事件新闻造成的开放集识别问题和降低人工标注非突发事件新闻的成本,这是当前突发事件识别与分类研究的重要课题。[方法/过程]选择BERT预训练模型获得文本的特征表示,融合不同层级之间的语义信息增强文本表示的质量,采用自适应决策边界模型,学习各突发事件类别在高维语义表示空间上的球形最佳决策边界,根据新闻样本的文本表示和各突发事件类别的球形最佳决策边界的欧几里得距离,检测出突发事件新闻并判断突发事件的类别,并在CEC公开数据集和实时爬取的中文新闻数据集CEN上对模型的有效性进行验证。[结果/结论]实验结果表明,本文模型在CEC数据集和CEN数据集上的宏F1值分别为98.46%和95.80%,与基准模型相比,本文模型的宏F1值分别提升了5.15%和19.69%。模型应用展示了提出方法在解决实际问题时的有效性。[局限]未考虑突发事件新闻可能存在多标签的情况。  相似文献   

5.
[目的/意义] 引文情感分析揭示施引文献对被引文献的褒义、贬义和中性的情感倾向性,解析文献之间深层语义关系,能够帮助更加准确地评价被引文献和作者。[方法/过程] 以自然语言处理领域文献的引文情感为数据集,利用引文中情感表达的引文标识位置指引和情感词汇等特征,采用支持向量机(SVM)构建引文情感的自动识别系统,探索生成更大规模数据的方法。[结果/结论] 实践应用证明,该系统特征的区分度较强,准确率达到93.4%,识别效果较好。引文情感的自动识别系统实用价值较强,拓宽了引文网络分析的研究方法和内容,能够完善论文评价体系。  相似文献   

6.
[目的/意义]金融科技包括的技术主题及范围边界并不清晰,使得“IPC分类号+关键词”的传统专利检索和分类方法效果不佳,需要针对跨领域专利数据的分类及识别流程进行研究。[方法/过程]构建了一套结合文本挖掘、层次聚类、置信学习和自然语言处理等技术的方法流程,能够直接从专利说明书中获取分类体系并形成相应分类模型。[结果/结论 ]提出一种构建跨领域专利分类体系及自动识别方法的流程框架,形成了较为全面、客观的金融科技专利技术分类体系,以及较为准确高效的分类模型,并对国内金融科技专利的发展情况进行了分析。[创新/局限]未来可基于Bert等大规模预训练模型的Prompt Tuning方法,进一步降低人工参与成本并提升效率。  相似文献   

7.
[目的/意义]在科学知识快速更迭的时代背景下,文献引用不规范行为逐渐演化为潜踪匿迹、形式多样的复杂现象,通过文献来源信息建立引用不规范行为的识别方法,并揭示其形成过程的影响因素与内在机理,对于科技期刊规范化、科学评价体系公平化、学术生态环境完善化具有重要意义。[方法/过程]首先,构建引文内容相似度、使用—引用转化率、耦合强度等多维度判定指标;其次,结合相关文献特征与引用内容特征,探究不规范引用行为背后的影响因素与引用情境。[结果/结论]本文在300万条文献耦合数据中发现了近4万组隐形三角引用关系,表征了隐形三角引用行为在科学界的普遍存在。在引用情境分析中,文献语言、文献类型、所属学科领域是文献C转引文献A的影响因素,文献A、B所在期刊影响力、自身被引影响力、发表时间差异是文献C选择匿引文献B的影响因素。科学界应意识到这种不规范引用行为的紧迫性和重要性,逐步建立识别与监督机制。  相似文献   

8.
马雨萌  黄金霞  王昉  芮啸 《情报杂志》2022,(11):157-163
[研究目的]为实现科技政策文本内容的自动编码与多主题分类,探索一种融合BERT模型和多尺度CNN模型的多标签分类方法,得到更加丰富的政策语义特征信息。[研究方法]针对科技政策内容句的信息密度大、内涵分布不均衡等特点,通过BERT充分提取政策内容的上下文信息,增强文本的语义特征表示;然后利用多尺度、多通道的CNN-Inception模块提取更多尺度的特征,通过捕获文本的局部特征与组合不同尺度的语句特征,提升模型在多标签分类任务上的性能。[研究结论]对比实验表明,与单一BERT分类模型相比,文中提出的BERT-多尺度CNN模型的召回率与Micro-F1值显著提高,提升了科技政策多标签分类的效果。  相似文献   

9.
王佳敏  吴乐艳  李鹏程  熊资  陆伟  杜佳 《情报科学》2021,39(11):173-179
【目的/意义】本文构建了一个大规模学术文献致谢功能数据集,并提出一种基于SciBERT的致谢功能识别 模型,为致谢文本的挖掘和分析提供高质量的数据支持和有效的识别方法。【方法/过程】采用人工的方式扩展和完 善致谢功能分类规则,生成学术文献致谢功能自动标引规则模板,对1,750,275条致谢文本进行功能标引。在此基 础上,采用 SciBERT 模型对致谢文本句进行向量表达,引入 Softmax 回归模型实现致谢功能自动分类,采用 warmup策略进行模型调优,并与基准实验进行对比。【结果/结论】得到一个大规模、高质量的学术文献致谢功能数 据集,经人工检验准确率达到93%;基于SciBERT的识别模型比基准模型表现更好,在扩展数据集上的F1值高于 98%,在各个类别上的预测结果也有不同程度的提升。【创新/局限】致谢功能识别模型缺少对致谢文本独有特征的 考虑和融合。  相似文献   

10.
[目的/意义]科学数据已经成为数据驱动型科研的重要资料和产出成果,研究科学数据引用可以帮助追踪数据的使用状况、开展数据计量和评价、加速科研进程。[方法/过程]以生物信息学领域学术论文全文信息作为研究对象,利用规则抽取和人工标注形成了生物信息学引文分类数据集,对比评估6种深度学习模型与3种传统机器学习模型在数据集上的分类和识别效果。[结果/结论]实证研究效果显示,采用考虑语义和上下文特征的深度学习方法在科学数据正式引用识别任务中具有更优效果。[局限]未充分考虑数据类别不均衡问题。  相似文献   

11.
【目的】 分析医学学报类期刊被中国科学引文数据库(CSCD)引用的情况及特点,为办好医学学报提供思路。【方法】 选择被CSCD和《中文核心期刊要目总览》共同收录的16种医学学报,检索得到16种医学学报2013—2015年发表的论文被CSCD收录期刊引用的施引文献列表,分析施引文献的发表期刊、语种分布、作者机构及研究方向。【结果】 自身施引在该类期刊被CSCD引用中占主导作用,很少有CSCD收录的英文期刊施引该类期刊,本机构作者施引对其被引的贡献较大。施引文献研究方向除内科学、肿瘤学和外科学外,还有一些医学交叉学科。【结论】 医学学报需要继续扩大影响力,特别是对非本机构作者;加大宣传力度提高被引机会;注意重点、交叉学科和科研机构,从而提升质量、稳定发展。  相似文献   

12.
【目的】 为科技编辑出版中的参考文献引用、引文内容鉴审、引用格式规范化,以及科技期刊引文分析和学术评价提供整体性的思维框架和理论参考。【方法】 通过分析科学引证的概念,提出由科学论著、参考文献和引文内容三要素构成的科学引证概念模型。【结果】 根据科学引证概念模型,从科技编辑视角,系统分析了科学论著、参考文献与引文内容的相互作用关系。【结论】 科学引证概念模型分析发现了科技编辑出版和引文分析中存在的问题和缺陷,并得到若干有益的启示,启发值得引起重视的研究课题。  相似文献   

13.
[目的/意义]为了帮助情报学学科背景的就业人员掌握市场对情报学人才的具体需要,为情报学的教育者拟定情报学的教育体系和人才培养的目标提供指导。[方法/过程]采集国内各大招聘网站情报学相关职位招聘公告,构建情报学招聘语料库,基于CRF机器学习模型和Bi-LSTM-CRF、BERT、BERT-Bi-LSTM-CRF深度学习模型,从语料库中抽取5类情报学招聘实体进行挖掘分析。[结果/结论]通过在已有2000篇经过标注的职位招聘公告语料库上开展情报学招聘实体自动抽取对比实验,识别效果最佳的CRF模型的整体F值为85.07%,其中对"专业要求"实体的识别F值达到了91.67%。BERT模型在"专业要求"实体识别任务中更是取得了92.10%的F值。使用CRF模型对全部符合要求的5287篇招聘公告进行实体抽取,构建了情报学招聘实体社会网络,并通过信息计量分析与社会网络分析的方式挖掘隐含知识。  相似文献   

14.
基于BERT的领域本体分类关系自动识别研究   总被引:1,自引:0,他引:1       下载免费PDF全文
【目的/意义】实现对领域本体分类关系的自动学习识别,解决领域本体知识框架结构体系的自动化构建问 题。【方法/过程】通过对领域本体分类关系自动识别的国内外研究现状及存在问题进行分析总结,以当前开源的先 进的深度学习文本预训练模型BERT为基础,研究构建了基于BERT的领域本体分类关系自动识别模型,并以资源 环境学科领域为例进行了实验研究和评估分析。【结果/结论】基于BERT构建的分类模型能够实现对领域本体分类 关系的自动识别,识别方法和流程具有极大地通用性和可移植性,识别精度比传统方法有了较大提升。【创新/局 限】微调与泛化了BERT,提高了领域本体分类关系识别模型的通用性和精度。但由于受分类标注语料的质量限 制,模型精度尚未达到峰值,有待进一步优化提升。  相似文献   

15.
[目的/意义]在自动摘要技术的基础上,结合专利特性,提出一种专利技术功效特征的自动抽取方法.[方法/过程]抽取对象包括核心技术内容、功能效用描述两部分;根据专利的文本结构特性设计抽取方案;对所抽取到的技术内容语句进行核心性计算和评价,对所抽取到的功能效用语句进行情感分析,凝练和筛选后得到专利技术功效特征.[结果/结论]...  相似文献   

16.
[目的/意义]论文查重和查新功能是数字图书馆提供的信息服务之一,对学术界健康发展起到重要的作用。然而目前国内各高校图书馆的检测系统大多针对文字进行检测,而图像方面的检测鉴别存在很大的局限性,致使论文中对图像篡改的学术造假日益增多。因此,研究图像造假检测具有重大的意义。[方法/过程]针对这一问题,本文提出了一种能够鉴别论文中图像造假行为的模型,对图像数据检测平台框架进行设计。[结果/结论]通过实验证实了该模型的可行性与有效性,能够为数字图书馆图像篡改检测提供借鉴,提升信息服务质量,具有一定的理论价值。  相似文献   

17.
[目的/意义]实现对领域概念的自动学习抽取,解决领域本体自动化构建的首要基础任务。[方法/过程]以无监督的学习方法和端到端的识别模式为理论技术基础,首先通过对主流词嵌入模型进行对比分析,设计提出了基于Word2Vec和Skip-Gram的领域文本特征词嵌入模型的自动生成方法;其次研究构建了以IOB格式的标注文本作为输入,基于自注意力机制的BLSTM-CRF领域概念自动抽取模型;最后以资源环境学科领域为例进行了实验研究与评估分析。[结果/结论]模型能够实现对领域概念的自动抽取,对领域新概念或术语的自动识别也具有一定的健壮性。[局限]模型精度尚未达到峰值,有待进一步优化提升。  相似文献   

18.
[目的]利用向量空间描述语义信息,研究基于词向量包的自动文摘方法;[方法]文摘是文献内容缩短的精确表达;而词向量包可以在同一个向量空间下表示词、短语、句子、段落和篇章,其空间距离用于反映语义相似度。提出一种基于词向量包的自动文摘方法,用词向量包的表示距离衡量句子与整篇文献的语义相似度,将与文献语义相似的句子抽取出来最终形成文摘;[结果]在DUC01数据集上,实验结果表明,该方法能够生成高质量的文摘,结果明显优于其它方法;[结论]实验证明该方法明显提升了自动文摘的性能。  相似文献   

19.
[目的/意义]对基于z指数的科研机构评价有效性进行实证研究,旨在为科学合理地评价科研机构学术影响力探寻新的视角和方法。[方法/过程]本文采用新的综合性评价指标——z指数,以Muscular Dystrophy研究领域最具代表性的25家机构为样本,通过计算分析目标数据的z指数、h指数、p指数、总发文量、总被引次数和平均被引率、一致性指标η,验证了利用z指数评价机构学术影响力的有效性。[结果/结论]结果表明z指数是一个3D效能指标并具有高灵敏性和稳定性。同时也指出z指数存在诸如低引用长尾严重影响z指数大小、高核区论文被引的增加会对z指数产生副作用、忽略专利等其他科研形式的作用的缺陷,为后续研究奠定基础。  相似文献   

20.
[目的/意义]评价期刊知识交流效率对正确评价期刊在学术交流中的地位以及作用具有重要的参考价值。[方法/过程]选取29种CSSCI管理学期刊为对象,构建学术期刊知识交流效率评价指标体系。采用信息熵方法计算学术期刊知识产出指标权重,并合并成一个综合产出指标。采用随机前沿分析方法SFA测算学术期刊知识交流效率。[结果/结论]期刊知识交流效率是评价期刊影响力的重要指标,CSSCI管理学期刊知识交流效率整体较低,期刊之间效率差距较大。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号