共查询到19条相似文献,搜索用时 812 毫秒
1.
共词聚类分析法中的主要问题与对策 总被引:3,自引:0,他引:3
共词聚类分析法通过聚类运算的方式对学科主题词进行划分,从而实现对学科结构的分析研究.聚类运算的结果,通常能把共现频次高的词聚在一起,而学科内主题词的分布与词的共现关系并不完全正向相关,因此,聚类运算的原理不完全符合学科研究点主题词分布的方式,是共词聚类分析法中的主要问题,并由此造成共词聚类分析存在许多不足的地方,主要表现在:聚类不稳定、聚类不完整、成员划分不合理以及容易造成没有意义类团的出现.问题的对策是:改进聚类算法、改变聚类策略、类团的弹性划分以及对结果的创新分析能有效弥补聚类算法的不足. 相似文献
2.
共词分析法应用的规范化研究——主题词和关键词的聚类效果对比分析 总被引:2,自引:0,他引:2
3.
本研究对MEDLINE中生物体类文献中高频主要主题词进行共词聚类分析,获取主题词之间的关联规则,利用UMLS语义关系进行结构化表达.从MEDLINE中选取<中华医学杂志>上的生物体类文献作为测试集,由专家人工抽取关系,与共词聚类得到的关联规则进行比较.利用共词聚类分析对生物体类主题词关系的挖掘及评价分析,为文本知识发现提供了一种新的尝试. 相似文献
4.
由于医学文献的主要主题词和次要主题词在文献中所反映出的重要程度不同,因此在预处理过程中首将主要主题词和次要主题词进行加权处理.在主题速选阶段采用改进信息熵算法对主题进行遴选,最后利用词分析中的战略坐标分析对热点主题进行描绘. 相似文献
5.
采用人工判读法、文献计量法和对比分析法,从定性和定量两个角度对共词分析法在国际上和中国国内的研究现状进行分析.通过人工判读法,将共词分析法的研究分为理论研究和应用研究,其中理论研究分为5类,应用研究分为4个层次;通过文献计量方法,对共词分析法在国际上和中国国内的总体研究发展趋势、文献类型、引用情况和应用领域进行分析;通过对比分析法,比较分析国际上和中国国内共词分析法的理论研究和应用研究之发展趋势的差异、在各类型共词分析法研究中的活跃程度和影响力的差异,以及共词分析法具体应用领域的差异. 相似文献
6.
本文以内分泌与代谢学科领域中六种核心期刊在2003 ~2007 年发表论文的全部主要主题词的频次,生成高频主题词的共现矩阵,利用SPSS 做聚类分析得到该学科当前研究热点.在共词聚类的基础上,绘制出2003 ~ 2007 年研究热点的基本框架---战略坐标图,揭示了该研究主题的内外部联系并对发展趋势进行分析.此外,通过社会网络分析揭示了该研究领域的核心主题,并应用Netdraw 对共词矩阵进行可视化,展现每个高频词之间的共现关系.本文将科学计量学和可视化技术结合应用于学科分析,目的是直观地揭示共词网络中隐藏的信息或知识,为科研人员对学科发展方向的决策提供参考. 相似文献
7.
8.
近十年国外对中草药研究的关注点——基于高频主题词的共现聚类分析 总被引:1,自引:0,他引:1
目的:调查国外作者发表的中草药研究文献, 分析国外作者对中草药研究的关注点.方法:对PubMed数据库中近10年由国外作者发表的有关中草药的文献进行主题词共现聚类分析, 下载这些文献的主题词并统计主题词出现的频次,截取高频主题词,形成主题词共现矩阵,对矩阵做聚类.通过分析各类的文献内容,得到该主题的研究热点.结果:共检出国外作者发表的论文2 609篇,出现频次超过20次的主题词为43个,聚类得到5个研究热点.结论:①中药抗炎免疫药理、植物型抗肿瘤药物药理、中药抗氧化作用药理以及中药制剂作为神经保护药的药理学研究、黄酮类化合物和生物碱类的药理学研究是中草药药理学研究的关注点;②糖尿病、哮喘等疾病是国外进行中草药治疗应用研究的热点病种;③含马兜铃酸中药的肾脏毒性研究和中草药引起中毒性肝炎的研究是中草药副作用研究的热点;④植物型抗肿瘤药物用于治疗前列腺癌的研究曾受到国外研究人员极大关注;⑤人参属等药用植物的化学成分和人参皂苷药理活性研究受到关注. 相似文献
9.
急性白血病相关基因的文本挖掘分析 总被引:2,自引:0,他引:2
从PubMed检索1966年到2005年9月6日间白血病与基因关系的相关文献3 529篇.经编程处理生成主题词词篇矩阵并进行聚类.通过聚类树图可将所提取的主题词/副主题词分成13类,经对比原始文献进行验证,全部29种基因中只与ALL相关的有3种, 占10.34%;只与AML相关的有8种,占27.59%.特异的可用于鉴别ALL和AML的基因有11种,占37.93%.通过主题词的共现关系进行聚类可以基本实现发现基因与疾病之间的联系,但该方法所获得的相关基因较少,不利于对疾病与基因关系的全面了解. 相似文献
10.
基于关键词和摘要相关度的文献聚类研究 总被引:1,自引:0,他引:1
现有的文献聚类方法都是通过文献关键词来进行的.本文在研究大量文献聚类方法的基础上,提出了一种通过文献关键词和摘要进行加权的新的文献聚类算法.首先,改进了传统相似度计算的方法,设计出基于关键词和摘要词加权的相似度公式,使文献相似度计算更加精确.其次,基于"文献距离越大,聚为一类的概率越小"的思想,提出了一种"最大距离聚类法",并给出了算法的详细步骤.最后,实现算法并进行了大量的实验仿真.通过改进相似度计算公式,调整关键词和摘要词的权重,提高了聚类的质量.结果表明,本文提出的文献聚类算法是一种行之有效的方法. 相似文献
11.
12.
应用改进的共词聚类法探索医学信息学热点主题演变 总被引:4,自引:0,他引:4
对传统的共词聚类方法进行完善:依据高频低频词界分公式选取高频词;计算粘合力确定每个类别的中心词;对比分析两个时间段,发现主题演变。以医学信息学为例,从PubMed数据库分别下载1999年-2003年和2004年-2008年该学科相关文献,提取主要主题词,进行共词聚类分析,探索医学信息学学科结构的演变过程。 相似文献
13.
基于共词分析方法的国内知识链研究热点分析 总被引:1,自引:0,他引:1
汇总统计CNKI全文数据库中知识链领域所涉及的关键词,利用SATI 3.2软件统计这些关键词的词频,确定我国知识链研究领域使用频率最高的32个关键词.然后构造共词矩阵、相关矩阵、相异矩阵,并在此基础上利用因子分析、聚类分析和多维尺度分析三种多元统计方法对不同的矩阵进行共词分析.最后,对分析结果进行讨论,归纳国内知识链理论研究热点. 相似文献
14.
运用共词分析的方法,检索CNKI数据库中的链接分析领域论文,确定高频关键词,用Bicomb建立关键词共词矩阵,以SPSS为工具进行因子分析和聚类分析,探讨国内链接分析的研究现状与研究热点,发现应用于链接分析的方法主要有引文分析、共链分析、可视化、社会网络分析等,链接分析算法主要包括PageRank算法、HIST算法、网页排序等,应用研究集中于网络信息资源评价、网站的网络影响力评价和大学评价. 相似文献
15.
本文以五年为一个时间段,采用共词分析方法对1998~2007年我国图书情报学科8种核心期刊文献中的高频关键词分别进行聚类分析与类团关系分析,列出了两个阶段聚类结果的类团关系表,绘制了两个阶段的类团关系图,并对这两个阶段我国图书情报学科的热点研究领域和主要研究领域进行了较为详细的对比分析,以期从微观层面上对我国图书情报学科不同时期的研究热点和主要研究领域进行揭示与把握。从分析结果上看,我国图书情报学科的研究热点具有一定的传承性、连续性、稳定性、发展性、阶段性和变化性的特点。 相似文献
16.
文章在综合运用共词(串)、聚类分析等定量语言学分析方法的基础上,结合图论相关原理构建了用于文献计量研究的定量语言学分析程序,并以国外2001-2010年文献计量研究领域为例,展示了这套程序的应用。 相似文献
17.
利用SPSS软件,对中国学术期刊网络出版总库收录的我国信息素质领域期刊论文进行共词分析。并借助聚类分析与多维尺度分析,探讨了我国信息素质领域的研究现状与热点。 相似文献
18.
19.
在分析现有文献计量软件的优缺点及利用文献计量方法进行科学研究的目的与工作流程的基础上,建立多种文献数据库题录字典,有效进行关键词的合并和修正,集成文献计量中统计、共词和聚类过程,设计和实现一种可视化的共词聚类分析系统。 相似文献