首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
陈慧茹  肖相泽  冯锋 《科学学研究》2016,34(12):1769-1776
基于已有政策共词网络研究基础上,以国家自主创新示范区科技创新政策为研究对象,提出了政策属性与关键词权重在网络分析中的影响和作用,进而引入扎根理论、词频分析和政策测量方法,建构基于政策属性与关键词权重的加权共词网络模型。模型构建之后,利用加权后的Ochiia系数计算关键词之间的距离建构关键词矩阵。基于加权共词矩阵进行结点分析和小团体分析,对比验证加权共词网络模型的可行性,同时在综合视角下展现了自主创新示范区科技创新政策的现状和不足,发现科技金融、产业发展和人才吸引与培养方面还存在改进空间,为后续的政策制定提供参考。  相似文献   

2.
介绍了共词分析方法,分析了目前共词分析方法中存在的问题,在此基础上提出了垂直加权、水平加权和混合加权共词分析。在实例分析部分,根据文献的来源和关键词在文献中的位置,设置不同水平权值和垂直权值,对数据进行加权共词分析,证明了加权共词分析法的有效性。  相似文献   

3.
【目的/意义】共词分析法是文献情报分析的重要方法,对促进学科领域等的研究和发展具有重要作用。针 对共词分析法中存在的文献层面和词层面“同量不同质”问题、高频孤立词问题等,提出一种基于文献多属性加权 的共词分析方法。【方法/过程】该方法利用文献发表时间、被引次数和下载量等属性来度量文献时效性和被关注 度,以表征文献层面的权重;利用文献标题和摘要等属性对文献关键词的差异性进行度量;综合文献权重和词差异 性权重对共词分析词频次及共词对频次进行加权处理,然后依据二者加权后的频次确定共词分析用词集合及构建 共词矩阵。【结果/结论】以CNKI数据库有关主题模型研究的核心期刊论文为数据源,对该领域的研究主题热点进 行分析,从共词分析用词选择和聚类分析等方面与一般共词分析法进行对比,验证了本文所提加权方法具有一定 的合理性和有效性。  相似文献   

4.
在对中国1995—2017年的239份企业技术创新政策原文进行定性分析的基础上,将其划分为4个阶段。运用扎根理论提取各个阶段的关键词,引入TF-IDF加权技术和政策效力等级,分别为各个阶段的关键词和政策文本加权,借鉴余弦相似度的概念构建各阶段关键词加权共词矩阵。通过对各阶段加权共词网络的小团体分析,梳理了整体政策演进过程,分析出了6条规律,并依此针对政府和企业分别提出了相应的政策建议。  相似文献   

5.
【目的/意义】文献计量学方法是研究学科发展趋势、捕捉学科前沿热点的一种定量化的方法。共词分析是 一种重要的文献计量学方法,一般将作者选定的关键词作为最常用的词源。但科技论文中作者给出的关键词个数 有限,会存在缺失或者不能充分表达主题等情况,从而导致丢失一些重要的共现关系。【方法/过程】本文采用组块 分析的方法从文章标题中提取短语或词作为作者给定关键词的有益补充。【结果/结论】以中文句法分析领域的文 献作为研究对象进行实验,结果证明增补后的关键词列表增加了共现关系,优化了聚类结果。最后对中文句法分 析领域发展趋势及研究热点进行了分析。  相似文献   

6.
以Scopus数据库和Web of Science数据共同收录的图书情报学领域的38种期刊近10年所刊载的研究论文为数据源。利用共词聚类分析获得各个研究主题类团。基于关键词及其在文献中的共现情况,构建词共现关键词网络。并利用社会网络分析方法从网络中心性角度分析每个关键词在网络中的地位,以及它们之间的联系,揭示研究主题的结构特征。最后通过二维战略坐标图识别不同主题类团之间的演变趋势。  相似文献   

7.
李旭晖  周怡 《情报科学》2022,40(3):99-108
【目的/意义】关键词抽取的本质是找到能够表达文档核心语义信息的关键词汇,因此使用语义代替词语进 行分析更加符合实际需求。本文基于TextRank词图模型,利用语义代替词语进行分析,提出了一种基于语义聚类 的关键词抽取方法。【方法/过程】首先,将融合知网(HowNet)义原信息训练的词向量聚类,把词义相近的词语聚集 在一起,为各个词语获取相应的语义类别。然后,将词语所属语义类别的窗口共现频率作为词语间的转移概率计 算节点得分。最后,将TF-IDF值与节点得分进行加权求和,对关键词抽取结果进行修正。【结果/结论】从整体的关 键词抽取结果看,本文提出的关键词抽取方法在抽取效果上有一定提升,相比于TextRank算法在准确率P,召回率 R以及 F值上分别提升了 12.66%、13.77%、13.16%。【创新/局限】本文的创新性在于使用语义代替词语,从语义层面 对相关性网络进行分析。同时,首次引入融合知网义原信息的词向量用于关键词抽取工作。局限性在于抽取方法 依赖知网信息,只适用于中文文本抽取。  相似文献   

8.
陈立新 《现代情报》2009,29(10):196-200
本文运用科学计量学方法对近20万条力学SCI专业期刊论文数据进行统计和分析,得到了前20个高频关键词的共现矩阵。通过对前20个高频关键词的共词分析,利用Jaccard指数考察了前20个高频关键词之间的关系,并用知识图谱的方法映射出固体力学和流体力学研究内容之间的复杂网络关系。  相似文献   

9.
专利关键词是对专利文献的高度概括,正确提取专利文献中的关键词对于专利文献的分类、标引、聚类等具有重要意义。结合专利文献的特点,在目前已有方法的基础上,提出了专利文献中领域公共词提取方法、词素加权方法以及并列结构惩罚的方法,将其应用到专利文献关键词抽取中。在过滤公共词的基础上,综合运用词在文献中出现的位置、词频、词素和并列结构计算词对文献主题的影响度,抽取专利文献中的关键词。实验结果表明,在抽取关键词个数为5-9个时,所提方法优于局部加权TF-IDF方法,验证了所提方法的有效性。  相似文献   

10.
共词聚类分析方法是科技情报分析的一种重要的方法和技术,已逐渐发展成为科技情报分析中最活跃的研究领域之一。共词聚类分析方法可以形成一系列由科技文献组成的文献聚类,这些聚类所包含的主题特征对于揭示学科领域知识发展变化具有很好的指示作用。本文分析了基于词频统计共词分析的主题识别方法及其局限,提出基于概率模型的主题识别方法。实验表明,该方法可以充分地利用概率模型的优点,改进了传统共词分析方法的不足,从而可以更好地应用于主题分析中的主题识别环节。  相似文献   

11.
李海林  林春培 《科研管理》2022,43(1):176-183
   鉴于传统方法对科研成果关键词研究存在较强主观影响和较少考虑时间因素等问题,提出基于时间序列聚类的科研成果关键词分析方法。该方法通过统计分析方法验证关键词出现顺序在一定程度上反映了关键词反映主题思想的重要性,将关键词的重要度转化为时间序列数据,分别从重要度的数值和趋势两个角度出发,使用动态时间弯曲方法度量关键词重要度时间序列数据之间的相似性,结合近邻传播方法对关键词时间序列数据之间的相似性矩阵进行聚类分析,实现科研成果的关键词分析研究。通过对某科研管理类重要期刊2008—2017年期间刊发的科研成果论文关键词研究发现:新方法不仅可以对科研成果中关键词的关注热度和趋势进行聚类划分,自适应地找到中心关键词作为相应类别的特征代表对象,还能为科研成果关键词的主题分析提供理论方法和决策支持。  相似文献   

12.
高劲松  黄梅  付家炜 《现代情报》2021,40(12):130-139
[目的/意义] 能以简洁的可视化来追踪某学科研究热点随时间的变化趋势,对于掌握学科研究热点的动向具有重要意义。词频分析法是学科研究热点分析方法之一,目前存在众多的基于词频分析的可视化工具,但是这些可视化工具能够以简洁的可视化形式清晰地展现年度热点存在局限性。[方法/过程] 因此本文提出通过学科领域年度发文量与学科全部发文量的比值来衡量年度热点关键词对总年度热点关键词贡献率的可视化方法:基于年度贡献率与二八定律设定并调整阈值参数来控制年度高频关键词的呈现数量,将选取的年度高频关键词按照词频大小与年份依次排序以实现研究热点可视化。[结果/结论]以"关联数据"领域为例进行实证研究,通过分析本文方法提取的高频关键词与现有高频词阈值算法的匹配情况,对比本文方法与Citespace共现图谱的可视化呈现效果,对本文方法的可行性进行检验与评价。  相似文献   

13.
庞庆华  董显蔚  周斌  付眸 《情报科学》2022,40(5):111-117
【目的/意义】负面在线评论已成为商家重要的经营决策信息,对了解客户消费满意度、改善产品和服务质量 具有重要意义。【方法/过程】该文将情感分析和关键词抽取相结合,提出一种基于BiGRU-CNN 和 TextRank的在 线评论负面关键词抽取方法,即首先对在线评论文本数据进行清洗,然后构建 BiGRU- CNN 情感分类模型对在 线评论进行情感分析,最后采取TextRank 方法抽取情感分析得到的负面评论中的关键词。利用这种方法,对十个 产品与服务类别的6万余条消费者在线评论文本数据进行实证分析。【结果/结论】实验结果表明,该方法能准确判 别客户负面在线评论情感倾向,F1值达92.41%,并且负面在线评论关键词抽取结果能较好帮助商家完善产品质量 和服务。【创新/局限】提出一种结合双向GRU 和CNN 结合的情感分类模型,在此基础上基于TextRank 方法抽取 情感分析得到的负面评论中的关键词,进一步提升模型对于在线评论情感分析的准确性。  相似文献   

14.
本文介绍了一种建立在指代消解基础上的自动文摘方法。创新之处是在对文档内容使用自然语言处理技术全面分析的基础之上,只需对关键句进行指代消解,缩小了消解的范围,降低了对指代消解的要求。同时模拟人性思维,对于出现在不同位置的关键词和句子赋予不同的权重,凸显出含有关键词和总结性的句子。实验证明这种方法是可行的,有效的。
Abstract:
This paper introduces a method of automatic summarization which is based on anaphora resolu- tion. Based on the comprehensive analysis of the utilization of natural language processing technologies to process text file,its innovation is that you only have to make anaphora resolution for Keywords. Both the range of and the requirement for anaphora resolution are reduced. At the same time,the method simulates human thinking,gives different weights to keywords and sentences in different positions,and highlights the sentences containing keywords and sumups. The experimental results show that this method is feasible and effective.  相似文献   

15.
16.
【目的/意义】从海量微博信息中提取准确的主题词,以期为政府和企业进行舆情分析提供有价值的参考。 【方法/过程】通过分析传统微博主题词提取方法的特点及不足,提出了基于语义概念和词共现的微博主题词提取 方法,该方法利用文本扩充策略将微博从短文本扩充为较长文本,借助于语义词典对微博文本中的词汇进行语义 概念扩展,结合微博文本结构特点分配词汇权重,再综合考虑词汇的共现度来提取微博主题词。【结果/结论】实验 结果表明本文提出的微博主题词提取算法优于传统方法,它能够有效提高微博主题词提取的性能。【创新/局限】利 用语义概念结合词共现思想进行微博主题词提取是一种新的探索,由于算法中的分词方法对个别网络新词切分可 能不合适,会对关键词提取准确性造成微小影响。  相似文献   

17.
吴蕾  梁晓贺  宋红燕 《现代情报》2019,39(8):137-142
[目的/意义]针对处于萌芽期的学科领域文献量不足、技术  相似文献   

18.
奉国和  梁晓婷 《情报科学》2012,(1):144-148,160
利用SPSS软件,对CNKI数据库中2005~2010年间的国内推荐引擎领域论文进行共词分析,并借助聚类分析和因子分析,研究关键词之间的关系,绘制该领域的战略坐标图,探讨了国内推荐引擎领域的研究现状与热点。  相似文献   

19.
介绍了共词分析法及其一般分析流程,指出目前共词分析中所用作者关键词存在不规范的现象,给出了对作者关键词进行规范化处理的思想方法及规范化处理应遵循的原则。并以图书馆个性化信息服务为研究主题,利用SPSS17.0软件,对规范化处理前后的关键词分别进行了聚类,对比聚类结果,说明对作者关键词进行规范化处理是共词分析的一个必要而有效的过程。  相似文献   

20.
[研究目的]寻找国内情报学领域期刊论文研究热点的分布特性,探讨我国情报学领域学术研究热点的基本演变轨迹。[研究方法]选择国内情报学领域21种期刊论文的关键词进行统计分析,统计时间从2000年至2020年,统计数据在万方数据库中进行。首先选择年度排序在前30次以上的关键词作为热点研究的统计对象,由此从中选出60个关键词作为情报期刊的基本热点关键词。其次用选出的60个关键词在万方数据库的全学科(注:这里的全学科指在万方数据库收录的所有学科)关键词中进行检索,检索时间为2000年至2020年,最后对比分析情报期刊的热点关键词在全学科中的个性化特征和全局性分布特征。[研究结论]实验结果表明,该统计分析揭示了我国情报期刊论文近20年来三个阶段的热点关键词演变轨迹。情报学热点关键词与全学科关键词存在超前和滞后现象,反映了情报学科与全学科具有相互学习和相互推进的发展规律,借此规律对我国未来情报学热点进行预测,预测出我国情报期刊论文未来延续出现和可能出现的72个热点关键词。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号