首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 468 毫秒
1.
基于引文内容分析的引用情感识别研究   总被引:1,自引:0,他引:1  
[目的/意义]针对自动识别论文引用情感问题,提出一种基于引文内容分析的识别方法并进行可视化展示,克服基于简单引用频次计量无法区分不同引用情感的问题。[方法/过程]首先,利用正则表达式抽取出论文全文中的引文内容信息;然后,利用TF-IDF算法筛选出引用情感特征词,结合情感词典,利用情感分析技术对引文内容进行引用情感识别;最后,利用可视化工具展示出引用情感整体分布情况。[结果/结论]该方法能够有效识别出抗衰老领域论文数据集中引用情感情况。实验结果显示,该领域正面引用占总引用次数的21%,中立引用占总引用次数的78%,负面引用仅占总引用次数的1%。与传统引文网络相比较,基于引用情感的可视化图谱可以有效识别出不同引用情感在整体数据集合上的分布情况。  相似文献   

2.
面向引用关系的引文内容标注框架研究   总被引:3,自引:0,他引:3  
引文内容分析能够帮助揭示文献引用关系的深层语义内涵。本文梳理了目前已有的引文内容标注体系,归纳出构建引文分类体系的三个主要维度,即引文功能,引文重要性,情感倾向。以支持文献引用关系分析为目标,针对引文内容分析设计出一个引文内容标注框架,其中包括揭示引文关系抽象性质的引文分类标注体系,描述被引文献具体内容的引用对象标注体系,以及记录引文客观特征的引文属性标注体系。具体的标注实验体现了该标注框架的可用性。图1。表6。参考文献56。  相似文献   

3.
基于引用频次开展的引文分析忽略了引文对施引文献的效用差异,依此展开资源评估、学术影响力判断难免受到“无效”引用干扰。为排除“无效”引文,提升测度及评价数据质量,文章从引文效用的角度,选择引文属性、功能、对象、情感等典型特征,建立引文标注框架。测试逻辑回归与支持向量机等方式对引文自动分类的效果,择优构建“效用视角下核心引文识别模型”。其中,为探索自动化分类方式,在数据标注阶段,除人工标引,还使用大规模预训练语言模型的对话系统ChatGPT进行自动分类标注,并进行建模效果测试,以期为引文自动分类方法及应用实践提供新思路。  相似文献   

4.
基于引文内容分析的档案学高被引论文引用特征研究方法,文章界定三种引用情感类型,实证研究基于引文内容的主题识别和情感类型识别。揭示档案学高被引论文反映的引用主题和引用行为动机。  相似文献   

5.
重复引用文献及其标注方式对引文分析研究的影响   总被引:2,自引:0,他引:2  
参考文献是科技论文的重要组成部分.多数科学研究都是在前人研究成果基础上的继续和发展.参考文献的标注不仅反映出科学研究的继承性、连续性和相关性,而且体现了研究者严肃的科学态度.引文分析是以文后参考文献为唯一数据来源的图书馆学情报学研究方法,是文献计量学的主要研究内容.由于它对科学研究具有较强的评价和预测功能,因而在图书情报界同仁的赞誉声中得到了积极发展.但作为一种新兴的研究方法,不妥之处也在所难免.在以往的研究中,人们曾对引文行为范畴、引文数据、引文数据处理等方面存在的问题进行了探讨.本文的目的则在于揭示重复引用文献及其标注方式对引文分析研究的影响.这里的重复引用文献是指一篇文章中不只一次引用的同一篇文献,重复引用文献的标注与统计直接影响着引文分析结果的准确性与可靠性.因此,该问题的研究对提高引文分析质量具有重要的现实意义.  相似文献   

6.
从引文内容角度对图书被引行为进行分析,可改善传统依靠被引频次、专家评论等数据进行图书评价的片面性,进一步提高图书评价结果的准确性和科学性。本研究从亚马逊中文网站上选取计算机、法律、医学、文学和体育五个学科领域的中文图书,通过人工采集方式获取图书在施引文献中的引文内容,由此构建包含2 288条引文内容的数据集;然后从引用位置、引用强度、引用长度以及引用情感等方面,分析中文图书被引行为,并比较不同学科领域之间的差异。实验结果表明:不同学科领域对中文图书的引用位置具有不同的分布特征,表现出明显的学科差异;引用强度主要在1—3次,文学领域的平均引用强度最高;引用句长度一般在20—160字之间;施引作者对图书的引用情感中,超过80%表现为中性,而含有感情色彩的引用中,正面引用明显多于负面引用。图5。表5。参考文献24。  相似文献   

7.
参考文献引用分类标注与科技期刊和论文的评价   总被引:6,自引:0,他引:6  
董建军 《编辑学报》2006,18(6):406-409
为了规范参考文献的引用,减小引文问题对科技期刊和论文评价所造成的影响,使得以引文为基础的各种分析方法在科技期刊和论文的评价中更加合理、更加科学,提出了参考文献引用分类标注的概念.依据被引文献对论文作用的不同和引用意义的差别,将论文所引用参考文献分为正相关性引用类、负相关性引用类和平行相关性引用类,建议在论文写作中标注出分类的标志,编辑和审稿人在编审时可据此核实参考文献引用的正确性.在论文评价时分类进行检索统计,有利于进一步规范引文分析的各项指标,变笼统的引文分析为细化的据类分析评价,使引文分析评价体系更加科学、更加可靠.  相似文献   

8.
提出维吾尔语情感语料库的构建规范,设计和实现维吾尔语情感语料库辅助整理系统。该系统结合维吾尔语情感语料的具体特点,多方面分析维吾尔语情感词汇的特征,利用条件随机场(CRFs)模型进行维吾尔语情感词汇的自动识别。测试结果验证该系统能够大幅度降低人工劳动,高效快速地标注维吾尔语情感词语料。  相似文献   

9.
学术文献引文上下文自动识别研究   总被引:2,自引:2,他引:0  
[目的/意义] 引文内容分析能够帮助揭示文献引用关系的深层语义内涵,而引文上下文识别作为引文内容分析的基础显得尤为重要。[方法/过程] 梳理已有引文上下文研究的现状,总结当前引文上下文识别的不足,在此基础上归纳引文上下文识别的5类特征,并采用文本分类和序列标注两种方法开展引文上下文自动识别实验。[结果/结论] 实验结果表明,本文提出的特征能够很好地提升引文上下文识别效果,且基于文本分类的SVM分类效果要优于基于序列标注的CRF。  相似文献   

10.
语料库是大量自然素材的有序集合,不仅为语言研究提供新的手段,也可以为自然语言信息处理相关研究提供重要支持。探讨了影响语料库标注的各种原因,以基于蒙古文语料库的《汉语人名拉丁转写方案》为例,分析了各项因子对语料库建设产生的作用,认为标注的规范化发展、标注的准确性、一致性、中立性、通用性是衡量语料库标注质量的关键因素。  相似文献   

11.
[目的/意义]基于图片的情感分析已逐渐成为情感分析的潜在研究热点。本文回顾与总结了图片情感分析的历史与现状,有助于相关研究工作的推进。[研究设计/方法]从传统的视觉情感分析方法和深度学习两个方向对图片情感分析相关研究的技术方法进行梳理并评述。[结论/发现]随着图片情感分析粒度的细化,进一步的研究方向在于深度学习算法和标注方式的优化;同时,加快带有情感标签图片数据集的开放进程,可以更好地推动研究者在此领域研究的不断深入。[创新/价值]深入梳理了图片情感分析现阶段的研究重点与未来发展方向,为该领域进一步研究提供相关借鉴。  相似文献   

12.
[目的/意义] 为更好地提升基于内容的引文分析效果,对国内外引用对象相关研究进行调研总结,为引用内容分析研究提供借鉴。[方法/过程] 通过调研国内外引用对象相关研究,梳理引用对象的概念定义、分类体系、应用领域和自动化识别等方面研究进展,总结当前引用对象研究不足并提出未来发展方向。[结果/结论] 引用对象从语义层面评价文献学术研究的贡献和利用价值,为引文分析方法增加了重要维度。引用对象研究需要从理论、技术和应用三个方向进行深化:理论上,加强多维度引用对象特征的研究和分析;技术上,探索基于大规模语料的自动化识别方法;应用上,尝试基于引用对象的科研评价服务。  相似文献   

13.
��[Purpose/significance] By using corpus-based sentiment analysis, opinion word polarity can be predicted in accordance with its context. The method is significant in applications oriented to specific-domains sentiment analysis tasks since it can improve the prediction accuracy.[Method/process] In the paper, context-oriented sentiment polarity identification for emotion expressions was investigated. A Pointwise Mutual Information(PMI) based algorithm was proposed to solve the problem. In terms of PMI, polarity of an emotion expression "feature-opinion" was inferred according to the co-occurrence of the expression with contextual opinion seed words. Furthermore, employing dependence relation analysis to detect sentimental reverse in context; with the modified PMI algorithm, we can predict polarity of emotion expressions in a sentence more accurately.[Result/conclusion] The results indicate, compared with the Lexicon-based method and the classical PMI, the modified method performs better. With it, opinion-words unlisted in lexicons can be identified, and context-specific sentimental orientation of an expression can be detected precisely as well. Modifying the macro F1 value to 0.827 and 0.878 in cater-review corpus and electronic-product review corpus separately. The algorithm, supported by large-scale domain-specific corpus and based on statistics and dependency analysis, is efficient due to convenience for data acquisition, which make it easier be applied in other domain-specific sentimental analysis tasks.  相似文献   

14.
基于修正点互信息的特征级情感词极性自动研判   总被引:1,自引:0,他引:1  
[目的/意义]基于语料的情感词发现依语句上下文推断情感词极性,能显著提升情感分析的准确率,在面向领域的特征级情感分析任务中有重要应用价值。[方法/过程]对特征级情感极性研判问题展开探讨,提出基于点互信息的"特征-情感"对情感极性自动判别算法,算法借助大规模领域语料,根据观点表达"特征-情感"对与情感语义明确的种子词的共现关系,同时引入依存句法分析语句间的情感转折,通过修正经典的点互信息算法,对上下文约束下的用户观点表达进行褒贬预测。[结果/结论]实验证明,修正算法的性能显著优于词典匹配算法和经典的点互信息情感识别算法,不仅能够推断词典中未纳入的观点表达的情感指向,而且能较准确地推断"语境"中的情感词极性。在餐饮评论和数码产品评论两个评测语料集上,修正算法的F1宏平均指标分别达到0.827和0.878。该算法以领域相关的大规模语料为支撑,基于概率统计和句法分析,因数据获取便利,算法效率高,移植性好,具有普适性,尤其适用于面向领域的情感分析任务。  相似文献   

15.
基于网络用户情感分析的预测方法研究   总被引:2,自引:0,他引:2  
网络用户情感分析领域的研究为特定领域社会行为的预测提供了新的方法和工具.本文分析了基于情感分析进行预测的逻辑基础、典型预测方法、关键技术以及当前存在的问题和发展趋势.研究发现:研究基于网络用户情感分析预测社会活动趋势的方法在政治、财经等多个领域具备应用条件;典型预测方法可归纳为以情感分析结果作为辅助依据的预测方法和以情感分析结果作为主要依据的预测方法;预测过程涉及情感分析源的选择、预测时间提前量的确定以及情感词统计处理三个关键环节;当前研究还存在网络用户情感的代表性,待分析语料的全面和正确获取,以及网络用户情感的正确分析和统计等问题,有待深入研究.  相似文献   

16.
[目的/意义]以用户情感为线索的图像检索已成为机器学习研究的热点,但图像情感特征标注的语料数据多来源于对图像低层特征的抽取,从而导致图像检索过程单一化和程式化。本文提出了一种基于深度学习的图像情感特征抽取的算法,将图像底层特征融合到图像的高层情感语义当中,为实现图像的情感语义检索提供了参考。[方法/过程]利用改进的卷积网络模型,将数据集图像的颜色、纹理作为输入,经多层运算自动提取图像的情感信息,并通过反向传播算法计算出改进后模型的情感检索准确率,构造出准确率较高且过拟合程度低的图像情感特征提取模型。[结果/结论]应用改进的卷积神经网络模型,实现了对图像情感特征的抽取,相较于原模型提升了10%的检索准确率。  相似文献   

17.
[目的/意义]为了解引文分析领域的发展状况,以领域知识载体之一--期刊文献为研究对象,通过知识单元特征描述和知识单元聚类层次结构,发现该领域知识发展的脉络和演进轨迹。[方法/过程]选择2001-2014年汤森路透Web of Science平台结构化的二次文献信息1 166条作为数据源,以信息计量学作为理论基础,利用统计分析、信息计量和分析复杂引文网络的社会网络分析方法,借鉴数据挖掘算法和处理工具技术,描述领域知识体系的特征。[结果/结论]从宏观与微观两个维度,以静态和动态两种方式,利用知识基础与研究前沿的时变对应,通过理论与实践的统一,准确地描述引文分析领域发展的宏观层次结构特征和微观节点属性、静态分布特征和动态演化规律、奠基性的基础理论和突破性的研究前沿。  相似文献   

18.
汉英双语标注集的研究与实现   总被引:1,自引:0,他引:1  
标注集是任何自然语言处理研究中的知识表达基础。本文结合汉英双向机器翻译开发和双语语料库加工的实践,提出了建立标准的汉英双语标注集的必要性,探讨了该标注集设计过程中遇到的几个关键问题并给出了一个比较完备的汉英双语标注集解决方案。实践证明,该方案具有良好的开放性和兼容性,对于汉英双向机器翻译系统和汉英双语语料库研究都具有适用性。  相似文献   

19.
基于被引次数的引文分析无法直接揭示论文的研究内容,利用关键词或从标题、摘要和全文中抽取的主题词很难客观反映论文的被引原因。本文以碳纳米管纤维研究领域的高被引论文为研究对象进行引文内容抽取和主题识别,经人工判读验证:基于引文内容分析的高被引论文识别的核心主题能够较好地揭示高被引论文的被引原因(引用动机),而且与论文的研究内容相符合;与基于全文、基于标题和摘要的主题识别相比,在引文内容分析基础上识别的主题具有更好的主题代表性,能够有效揭示被引文献的研究内容,是对原文相关信息的重要补充。本文的实验表明基于引文内容分析的高被引论文主题识别是可行而且有效的。图4。表4。参考文献31。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号