首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 109 毫秒
1.
文献数据库中书目信息共现挖掘系统的开发   总被引:9,自引:0,他引:9  
针对权威的生物医学数据库和引文索引数据,介绍一个基于文献数据库中书目信息共现关系进行文本挖掘的系统。该系统具有基本的文献计量学分析功能,并对相应的结果进行可视化表达;对高频主题词、高产作者和高被引论文和高被引作者进行共现分析,据此进行聚类分析和关联分析,获得有关的研究主题聚类和主题词/副主题词关联规则、合著聚类分析、高被引论文同被引聚类分析和高被引作者同被引聚类分析的结果和可视化表达。其中对关联规则的分析可以发现主题词之间的潜在语义规则,其他的文献计量学指标和共现分析结果可以用于科学计量学的分析。  相似文献   

2.
基于主要主题词加权的共词聚类分析法效果研究   总被引:4,自引:1,他引:3  
共词聚类分析法在词对共现频率的基础上,采用聚类的算法把词(通常是主题词)聚集成类,从而揭露隐含在文献群中知识.词对共现频率结果的准确性、科学性是共词聚类分析成功的关键.本文对共词聚类分法中的词对共现频率进行深入的分析,认为在文献的标引中存在主要主题词与次要主题词的差别,在词对共现频率计算时应对主要主题词进行加权计算,从而突出主要主题词在聚类过程中的主导地位.通过实例的对比分析,说明这种加权对共词聚类分析法的改进是有效的,也是有必要的.  相似文献   

3.
文献计量学共引分析系统设计与开发   总被引:24,自引:5,他引:19  
崔雷  胡海荣  李纪宾 《情报学报》2000,19(4):308-312
本文主要介绍运用VisualFoxPro5.0,利用文献计量法中同被引聚类分析、共词聚类分析和共篇聚类分析原理,设计文献计量共引分析系统,对来自SCI和MEDLINE光盘的文献实现由专题文献直接形成直观聚类图的过程。本系统主要包含以下模块同被引分析,共词分析,共篇分析,聚类,帮助。  相似文献   

4.
共词聚类分析法中的主要问题与对策   总被引:3,自引:0,他引:3  
共词聚类分析法通过聚类运算的方式对学科主题词进行划分,从而实现对学科结构的分析研究.聚类运算的结果,通常能把共现频次高的词聚在一起,而学科内主题词的分布与词的共现关系并不完全正向相关,因此,聚类运算的原理不完全符合学科研究点主题词分布的方式,是共词聚类分析法中的主要问题,并由此造成共词聚类分析存在许多不足的地方,主要表现在:聚类不稳定、聚类不完整、成员划分不合理以及容易造成没有意义类团的出现.问题的对策是:改进聚类算法、改变聚类策略、类团的弹性划分以及对结果的创新分析能有效弥补聚类算法的不足.  相似文献   

5.
利用关联规则算法,对PubMed数据库中的4种抗肿瘤药物主题词和副主题词组配模式进行分析,并以文献和教科书标准,抽取出与这四类药有关的、有效的语义关系搭配模式,从而为文献检索和建立知识库提供依据。  相似文献   

6.
近十年我国乳腺癌文献计量指标及研究热点分析   总被引:1,自引:0,他引:1  
文章以SCIE为数据源,利用文献计量学方法,对2000-2009年我国乳腺癌研究发表文献被SCI收录情况,分别通过不同层面进行统计分析,并与其他国家相关数据进行比较。结合共词聚类分析法与文献被引频次,运用BICOMS软件统计高频主题词以及高频被引文献,并利用SPSS软件进行聚类分析。以期总结我国乳腺癌的研究热点,为相关专业人员深入开展乳腺癌研究提供参考。  相似文献   

7.
本文以内分泌与代谢学科领域中六种核心期刊在2003 ~2007 年发表论文的全部主要主题词的频次,生成高频主题词的共现矩阵,利用SPSS 做聚类分析得到该学科当前研究热点.在共词聚类的基础上,绘制出2003 ~ 2007 年研究热点的基本框架---战略坐标图,揭示了该研究主题的内外部联系并对发展趋势进行分析.此外,通过社会网络分析揭示了该研究领域的核心主题,并应用Netdraw 对共词矩阵进行可视化,展现每个高频词之间的共现关系.本文将科学计量学和可视化技术结合应用于学科分析,目的是直观地揭示共词网络中隐藏的信息或知识,为科研人员对学科发展方向的决策提供参考.  相似文献   

8.
急性白血病相关基因的文本挖掘分析   总被引:2,自引:0,他引:2  
闫雷  崔雷 《情报学报》2008,27(2):169-174
从PubMed检索1966年到2005年9月6日间白血病与基因关系的相关文献3 529篇.经编程处理生成主题词词篇矩阵并进行聚类.通过聚类树图可将所提取的主题词/副主题词分成13类,经对比原始文献进行验证,全部29种基因中只与ALL相关的有3种, 占10.34%;只与AML相关的有8种,占27.59%.特异的可用于鉴别ALL和AML的基因有11种,占37.93%.通过主题词的共现关系进行聚类可以基本实现发现基因与疾病之间的联系,但该方法所获得的相关基因较少,不利于对疾病与基因关系的全面了解.  相似文献   

9.
应用改进的共词聚类法探索医学信息学热点主题演变   总被引:4,自引:0,他引:4  
对传统的共词聚类方法进行完善:依据高频低频词界分公式选取高频词;计算粘合力确定每个类别的中心词;对比分析两个时间段,发现主题演变。以医学信息学为例,从PubMed数据库分别下载1999年-2003年和2004年-2008年该学科相关文献,提取主要主题词,进行共词聚类分析,探索医学信息学学科结构的演变过程。  相似文献   

10.
在分析现有文献计量软件的优缺点及利用文献计量方法进行科学研究的目的与工作流程的基础上,建立多种文献数据库题录字典,有效进行关键词的合并和修正,集成文献计量中统计、共词和聚类过程,设计和实现一种可视化的共词聚类分析系统。  相似文献   

11.
目的:调查国外作者发表的中草药研究文献, 分析国外作者对中草药研究的关注点.方法:对PubMed数据库中近10年由国外作者发表的有关中草药的文献进行主题词共现聚类分析, 下载这些文献的主题词并统计主题词出现的频次,截取高频主题词,形成主题词共现矩阵,对矩阵做聚类.通过分析各类的文献内容,得到该主题的研究热点.结果:共检出国外作者发表的论文2 609篇,出现频次超过20次的主题词为43个,聚类得到5个研究热点.结论:①中药抗炎免疫药理、植物型抗肿瘤药物药理、中药抗氧化作用药理以及中药制剂作为神经保护药的药理学研究、黄酮类化合物和生物碱类的药理学研究是中草药药理学研究的关注点;②糖尿病、哮喘等疾病是国外进行中草药治疗应用研究的热点病种;③含马兜铃酸中药的肾脏毒性研究和中草药引起中毒性肝炎的研究是中草药副作用研究的热点;④植物型抗肿瘤药物用于治疗前列腺癌的研究曾受到国外研究人员极大关注;⑤人参属等药用植物的化学成分和人参皂苷药理活性研究受到关注.  相似文献   

12.
关于从MEDLINE数据库中进行知识抽取和挖掘的研究进展   总被引:28,自引:4,他引:24  
崔雷  郑华川 《情报学报》2003,22(4):425-433
本文对近年来国内外利用医学文献检索系统MEDLINE进行知识抽取和文本数据挖掘的研究进行了回顾和综述,包括Swanson等开展的从文献中发现隐藏的联系的研究,Cimino等人开展的从文献中抽取规则的研究,国外的共词及国内的共篇分析研究.并据此提出,在当前信息技术高速发展的条件下,应当充分开展知识抽取和文本挖掘的研究,为图书情报部门的服务功能从文献管理向信息管理和知识管理转化进行理论上的探索.  相似文献   

13.
张晗  赵玉虹 《图书情报工作》2016,60(11):135-142
[目的/意义]针对共词分析存在的普遍问题,提出一种基于细粒度语义分析的共词网络构建与分析方法。[方法/过程]借助SemRep实现源文本主题概念及其语义关系的规范化抽取并由此构建语义共词网络,然后以节点的中心度和边的频次为指标对内容特征词进行抽取,利用UMLS语义网络规定的语义搭配模式,通过概念-语义类型-语义类型组的两级映射,对语义述谓项进行类团划分。[结果/结论]通过与常规共词分析方法比较,发现基于细粒度语义关系的共词分析能有效地揭示文本主题内容,利用UMLS语义网络资源能从语义学角度清晰准确地对语义共词网络进行类团划分。  相似文献   

14.
刘洋  崔雷 《图书情报工作》2014,58(6):101-104
以引文上下文为研究对象,探讨来自于引文上下文、目标文献摘要以及目标文献自标医学主题词(下称主题词)三者间的符合程度,定量分析引文上下文在表征目标文献内容特征时的作用。以被Circulation杂志高频引证的5篇研究类论文作为目标文献,提取其施引文献的全部引文上下文,并对其进行分词及主题词匹配;将其结果与目标文献摘要提取的主题词以及文献自标的主题词进行两两比较。结果表明,引文上下文与目标文献摘要具有较高的符合度,而且在表征被引文献内容特征的效果上明显具有优势。  相似文献   

15.
Terminology used by health professionals in everyday written discourse was compared with terminology in a standardized medical vocabulary, the Medical Subject Headings (MeSH). Fifty written hospital charts were selected at random and analyzed by a computer program that identified MeSH terms in the charts. The charts were analyzed against two related MeSH vocabularies--one containing MeSH terms and one containing both MeSH terms and backwards cross-reference terms. When small words such as articles and prepositions were disregarded, approximately 50% of the words in a medical chart were found to be MeSH-related terminology. In addition, about 40% of MeSH-related words in the charts were either MeSH terms or backwards cross-reference terms.  相似文献   

16.
The primary goal of the present study is to discover new drug treatments by topology analysis of drug associations and their therapeutic group network. To this end, we collected 19,869 papers dated from 1946 to 2015 that are related to autism treatment from PubMed. We extracted 145 drugs based on MeSH terms and their synonyms (the total number is 6624) within the same ATC classification hierarchy and used them to find drug associations in the collected datasets. We introduced a new topology-driven method that incorporates various network analyses including co-word network, clique percolation, weak component, pathfinding-based analysis of therapeutic groups, and detection of important drug interaction within a clique. The present study showed that the in-depth analysis of the drug relationships extracted from the literature-based network sheds new light on drug discovery research. The results also suggested that certain drugs could be repurposed for autism treatment in the future. In particular, the results indicated that the discovered four drugs such as Tocilizumab, Tacrolimus, Prednisone, and Sulfisoxazole are worthy of further study in laboratory experiments with formal assessment of possible effects on symptoms, which may provide psychologists, physicians, and researchers with data-based scientific hypotheses in autism-drug discovery.  相似文献   

17.
利用EXCEL对2004-2009年CSSCI数据库中图书馆、情报与档案管理学科来源文献的关键词进行词频分析和共词分析,并使用SPSS17.0提供的因子分析和层次聚类分析方法探究各高频关键词之间的内在联系,旨在试图反映近年我国图情档学科的研究热点与重点领域,为人们探讨图情档学科核心内容与研究本质提供参考。  相似文献   

18.
Objectives: This study compared the mapping of natural language patron terms to the Medical Subject Headings (MeSH) across six MeSH interfaces for the MEDLINE database.Methods: Test data were obtained from search requests submitted by patrons to the Library of the Health Sciences, University of Illinois at Chicago, over a nine-month period. Search request statements were parsed into separate terms or phrases. Using print sources from the National Library of Medicine, Each parsed patron term was assigned corresponding MeSH terms. Each patron term was entered into each of the selected interfaces to determine how effectively they mapped to MeSH. Data were collected for mapping success, accessibility of MeSH term within mapped list, and total number of MeSH choices within each list.Results: The selected MEDLINE interfaces do not map the same patron term in the same way, nor do they consistently lead to what is considered the appropriate MeSH term.Conclusions: If searchers utilize the MEDLINE database to its fullest potential by mapping to MeSH, the results of the mapping will vary between interfaces. This variance may ultimately impact the search results. These differences should be considered when choosing a MEDLINE interface and when instructing end users.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号