首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
突发监测算法用于共词聚类分析的尝试   总被引:3,自引:0,他引:3  
Kleinberg算法能在不受外界因素影响的情况下及时发现未达到词频阀值要求但具有情报意义的词,用其计算突发词,并按突发权重排序,同时选择具有一定词频的突发词进行共词聚类分析,总结出当前医学信息学研究的热点领域。将分析结果与单一的高频词分析结果相比较,提出将突发词检测与高频词分析相结合以揭示信息科学的发展。   相似文献   

2.
本文回顾了档案术语学的发展概况及国内外研究进展,以及近年来在信息管理领域受到广泛关注的“本体(ontology)”理论,通过查阅国内外一些具有代表性的辞典、档案学著作的方法对比分析了以“Record”为纽带联结起来的“Document”和“Archive(s)”两词的词义以及其词源演变,并对两词的语义相似度及其在整个档案学常用术语体系中的语义、语用等进行了简单的梳理与辨析,借用复杂网络理论,探讨了档案学术语体系的网络特征以及在档案术语学研究中引入定量分析方法的可能性.  相似文献   

3.
为了解农业领域中微生物学、植物学领域的研究热点及走向,本文采用共词分析的方法,通过Excel、SPSS等软件,对CNKI数据库中2004-2014年间1604篇相关文献进行统计。通过分析得出高频关键词并建立共词矩阵。进一步对高频词共词矩阵进行聚类分析和多维尺度分析,认为植物、微生物领域研究热点主要集中在基因方面的研究进展、植物的应用分析、微生物的物理分析、生物技术及特性分析等四大主题上。其中在基因方面的研究进展属于最热门的研究领域。  相似文献   

4.
本文尝试分析在非相关文献知识发现中,标题对文摘的替代效果,标题和MeSH提供的信息内容与文摘提供的信息内容的近似度,标题与文摘提供的信息内容与MeSH字段提供的信息内容的近似度.通过统计各字段所有词的词频,从高频词的数量、分布及变化趋势等定量的方面,以及具体高频词和语义类型等定性方面对各字段进行对比分析.结果表明标题对文摘有很好的替代效果,标题与MeSH结合对文摘的替代效果较标题与文摘结合对MeSH的替代效果要好.  相似文献   

5.
从信息分析的实际需求出发,对与电动汽车相关的5 405条专利数据进行术语抽取、生僻术语识别和字段比较研究。结果显示关键短语抽取的方法可行,互信息抽取的术语所在文档的平均文档长度更接近集合的平均文档长度;摘要和First Claim字段的术语存在一定差别,但对分类或聚类同等重要;生僻术语识别算法能够发现生僻词和高频词的对应关系。研究结论可以为专利文本挖掘和专利信息分析提供结果和方法,并为信息分析工作提供所需的参考术语。  相似文献   

6.
主题词和关键词是共词聚类分析法中最常用的分析对象,但在相同的条件下,两者是否有相近的聚类效果?针对同一文献标本,采用同样的常规处理过程,对关键词和主题词的聚类效果进行对比统计分析,结果显示在高频词、类团成员及聚类质量上,存在较大差别。表明在共词聚类分析法的具体应用中,选择不同的对象时,不能简单套用相同的数据处理过程。最后,就共词聚类分析法的应用、处理规范等方面提出一些意见和建议。  相似文献   

7.
王刘安  常春 《图书情报工作》2014,58(13):107-112
对比分析国际标准ISO 25964-1、美国标准ANSI/NISO Z39.19-2005、中国标准GB/T 13190-1991中优选词的定义,总结优选词的4个特性,即抽象性、唯一性、关联性、可变性;并对《英文超级科技词表》构建过程中概念优选词选择方法进行研究,归纳4种优选词选择方法,包括基于来源叙词表、基于文献词频大小、参考中文叙词表以及参考专业人员和用户的推荐;最后讨论优选词选择过程中多种方法的加权,英文术语翻译多样性,词频类型的优先级以及优选词的可变性等问题。  相似文献   

8.
词频分析法是文献计量学的重要分析方法之一,而确定高频词阈值是进行词频分析的必要前提,高频词阈值的选取不仅决定词频分析法的分析结果,而且对整个分析研究都有着极其重要的影响。本文首先以近三年国内运用词频分析法展开研究的文献为调研基础,发现目前学界常用的高频词阈值选取方法主要有自定义选取法、高低频词界定公式选取法、普赖斯公式选取法及混合选取法四类;其次,以个人知识管理领域的文献为研究对象,对前三类高频词阈值选取方法分别进行取值计算并做领域热点聚类分析,对比验证聚类结果,同时以此结果为基础讨论高频词阈值选择对分析结果的影响及其合理性;最后,指出我国学界在高频词阈值选取方面存在主观性强、方法原理不明、改进方法适用性不明,高低频词界定公式和普赖斯公式适用性尚待研究等问题。  相似文献   

9.
在PAT数组的基础上,引入LCP数组记录文本后缀串的相同前缀长度,通过扫描LCP数组快速抽取文本高频词。该算法不依赖于分词词典,通过探测重复出现串来提取高频词,并能够抽取任意重复字符串,对新词、组合词抽取特别有效。实验结果表明,该算法抽取的高频词可以达到较高的可接受率,在与ICTCLAS系统关键词抽取的比较中也有较高的相同率,且在发现组合词方面更具优势。  相似文献   

10.
基于文献标题词汇共现获取词间关系研究   总被引:6,自引:1,他引:5  
通过词汇在文献里共现特征分析,可以为人工确定词间关系起到指引和减轻工作量的作用。文章具体使用水利水电领域专业词汇,通过在重庆维普核心科技期刊数据库中的共现频次和共现率的统计分析,以“水电站”与其他高频词组合检索,统计词频、共现频次以及共现率,结果认为,词频、共现频次、共现率等信息对人工确定词间关系具有指导意义,并且讨论了可能存在的问题及解决办法。  相似文献   

11.
运用共词分析的方法,检索CNKI数据库中的链接分析领域论文,确定高频关键词,用Bicomb建立关键词共词矩阵,以SPSS为工具进行因子分析和聚类分析,探讨国内链接分析的研究现状与研究热点,发现应用于链接分析的方法主要有引文分析、共链分析、可视化、社会网络分析等,链接分析算法主要包括PageRank算法、HIST算法、网页排序等,应用研究集中于网络信息资源评价、网站的网络影响力评价和大学评价.  相似文献   

12.
网络环境下共词分析方法的应用研究   总被引:5,自引:0,他引:5  
共词分析方法是图书情报研究中的一种十分有效的研究方法,在网络环境下其应用更加深入.本文利用SPSS11.0统计分析软件的因子分析、聚类分析以及多维尺度分析对1997-2007年间国外网络计量学的62篇研究论文进行了共词分析,验证了当前国外网络计量学的主要研究内容并进一步得出了未来的研究热点是链接分析和网络引文分析两个方面,充分显示了共词分析在解释学科研究主题方面的重要作用.  相似文献   

13.
对于科技内容的评价方式,仅从期刊文章被引的角度进行评判,在互联网时代已经显得不足了。互联网时代发表科技观点的多样性、传播的广域性、传播的快速性使得科技内容被利用的因素有很多。使用者对文章观点的态度、作者和专家公开发表的科技内容的情况、使用者利用互联网进行发现与利用的情况等,都可能是对科技内容进行评价分析的因素。  相似文献   

14.
情感分析研究的知识结构及热点前沿探析   总被引:1,自引:0,他引:1  
周建  刘炎宝  刘佳佳 《情报学报》2020,39(1):111-124
为了解国内外情感分析领域的研究状况,揭示该领域的知识结构、研究热点与发展动态,本文采用共被引分析、聚类分析、共词分析、战略坐标分析等方法,借助CiteSpace、UCINET、BICOMB、SPSS等软件,对Web of Science数据库收录的以情感分析为主题的相关文献进行计量分析与知识图谱绘制。分析结果表明,情感分析的应用、深度学习与神经网络、电子商务下的产品评论、事物情感特征评分、社交网络下用户生成内容、语义定向广告技术以及文本语言属性分析构建了情感分析的知识结构,产品评论与口碑、数据挖掘与人工智能、无监督学习、HadoopMapReduce与支持向量机以及神经网络与深度学习为该领域的研究热点,而顾客评论、推荐系统、极性分类、主题模型、电影评论、推特数据将是未来该领域主要研究方向。  相似文献   

15.
To study the explicit organizational knowledge pattern of an education and research institute is a tedious process as it deals with multiple subjects. Also, many qualitative and quantitative indicators such as peer review process, awards and honors received by the constitute members of the institute, national and international grants, and different types of publications can be considered to study the pattern followed in different disciplines over a period of time. Not all of these indicators will be giving the same message, and the choice of which one to select will depend on the type of research being evaluated. In this study to analyze explicit organizational knowledge, publications of Indian Institute of Science (IISc) in different disciplines over a span of 10 years from 1996 to 2005 are considered as given in the multidisciplinary database SCOPUS using correspondence analysis and cluster analysis.

According to correspondence analysis, the study indicated that publication productivity of IISc is on the rise during the study period and research in Engineering, Agriculture & Biological science, Chemistry and Life sciences is high. Although a cluster analysis is carried out to find out demarcations between row elements and column elements, no useful interpretation could be drawn.

However, this analysis has to be carried out further, by factoring indicators from research input as well as other socio-economic political, and cultural factors affecting the explicit organizational knowledge. Correspondence analysis and cluster analysis highlights what is interesting, and indicates the direction in which further inquiry should be done.  相似文献   

16.
To study the explicit organizational knowledge pattern of an education and research institute is a tedious process as it deals with multiple subjects. Also, many qualitative and quantitative indicators such as peer review process, awards and honors received by the constitute members of the institute, national and international grants, and different types of publications can be considered to study the pattern followed in different disciplines over a period of time. Not all of these indicators will be giving the same message, and the choice of which one to select will depend on the type of research being evaluated. In this study to analyze explicit organizational knowledge, publications of Indian Institute of Science (IISc) in different disciplines over a span of 10 years from 1996 to 2005 are considered as given in the multidisciplinary database SCOPUS using correspondence analysis and cluster analysis.According to correspondence analysis, the study indicated that publication productivity of IISc is on the rise during the study period and research in Engineering, Agriculture & Biological science, Chemistry and Life sciences is high. Although a cluster analysis is carried out to find out demarcations between row elements and column elements, no useful interpretation could be drawn.However, this analysis has to be carried out further, by factoring indicators from research input as well as other socio-economic political, and cultural factors affecting the explicit organizational knowledge. Correspondence analysis and cluster analysis highlights what is interesting, and indicates the direction in which further inquiry should be done.  相似文献   

17.
网络信息计量学软件及其开发方向探讨   总被引:2,自引:0,他引:2  
根据网络信息计量学的学科性质和研究内容,将支持网络信息计量研究的软件工具分为四大类:网络内容分析软件、网络结构分析软件、网站利用分析软件和数据处理软件;重点介绍CATPAC、TreeDec Tool、WebTrends Log Analyzer、Web-IAM 等四种软件,最后探讨网络信息计量学软件开发的趋势。  相似文献   

18.
基于引文分析法的国内"参考咨询"的研究现状分析   总被引:6,自引:1,他引:6  
本文以CSSCI数据库提供的被引数据为数据源,以“参考咨询”类论文为对象,利用引文分析方法,从引文量、高被引作者和高被引论文数量及被引次数、共被引次数三个方面,挖掘了论文“参考文献”中的隐含信息,从中分析近年来“参考咨询”研究的现状,指出其中存在的不足之处。最后讨论了用于引文分析的多元统计方法(聚类分析法、多维尺度分析法)针对不同对象的适用性。  相似文献   

19.
基于采访与外借的馆藏质量分析   总被引:3,自引:0,他引:3  
作者通过对广州图书馆2001—2002年间中文图书采购及外借情况的统计、比较,对全馆中文书的藏书质量进行了综合分析。  相似文献   

20.
本文从具有重要学术影响论文、关键词、核心作者研究方向三个角度着手对2000—2009年十年间中国知网学术资源总库中档案学的91325篇期刊论文进行分析,总结并说明十年来档案学研究重点问题、核心作者群体和十年档案学研究特点。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号