排序方式: 共有136条查询结果,搜索用时 15 毫秒
1.
因特网经济学未登录词计算机辅助挖掘试验 总被引:2,自引:0,他引:2
近年来随着社会经济科技和因特网的迅速发展,文献中不断涌现出大量未登录词。未登录词的存在严重影响了汉语自动分词与自动标引的准确率和速率。本文对1000篇经济类网页的关键部位———题名、摘要、关键词、首段进行未登录词挖掘试验,侧重对未登录词挖掘步骤设计和处理方法的讨论。 相似文献
2.
《Journal of Informetrics》2020,14(1):101004
The number of received citations have been used as an indicator of the impact of academic publications. Developing tools to find papers that have the potential to become highly-cited has recently attracted increasing scientific attention. Topics of concern by scholars may change over time in accordance with research trends, resulting in changes in received citations. Author-defined keywords, title and abstract provide valuable information about a research article. This study performs a latent Dirichlet allocation technique to extract topics and keywords from articles; five keyword popularity (KP) features are defined as indicators of emerging trends of articles. Binary classification models are utilized to predict papers that were highly-cited or less highly-cited by a number of supervised learning techniques. We empirically compare KP features of articles with other commonly used journal-related and author-related features proposed in previous studies. The results show that, with KP features, the prediction models are more effective than those with journal and/or author features, especially in the management information system discipline. 相似文献
3.
以1986-2005年间在我国内地发表的6068篇被软科学资助的论文为样本,采用科学计量学方法分析了20年来国内软科学资助论文的主要分布状况、结构变化、研究主题和研究热点,揭示了当前软科学的研究进展及学术前沿领域。 相似文献
4.
为了获取大量的语言学研究信息,在线文献检索模式的掌握至关重要,有时直接关涉语言学文献检索的效果。语言学文献检索的目的是获取所需的语言学研究信息,而文献检索编辑的目的是提供多种信息,而非单一的语言学研究文献信息。这种接受与给予之间的信息关联取决于检索者和编辑者之间的信息认知协调。从语言学关键词检索来看,检索者和编辑者的知识框架的认知偏离极易导致漏检、误检等诸多检索失误现象。如此检索失误有其更为深层次的认知动因,这无疑导致二者有关语言学典型信息的认知解析的差异。本研究指出,作为权势一方的编辑者应该关注弱势一方的检索者的认知取向,做到熟悉常规方式,力求统一检索模式,发展智能手段,从而达成双方的认知协调,进而实现语言学文献检索的最佳效果。 相似文献
5.
6.
叙述了引文耦合分析和关键词分析方法,详细分析用这两种方法结合来揭示竞争情报领域研究前沿及其研究基础的关键步骤,并用可视化的方法呈现。构建了1998—2008年国内竞争情报领域研究前沿的知识图谱,并输出了相关研究前沿的基础文献。 相似文献
7.
我国数字图书馆研究论文的计量学分析 总被引:1,自引:0,他引:1
8.
从关键词与高频词的相关度看自动标引的可行性 总被引:1,自引:0,他引:1
本文通过基于词频统计的内容分析法,将从文本中抽取的高频词与关键词进行匹配对比;根据抽样实验的结果分析了二者的相关度,并以此为基础论证了文献主题自动标引的可行性;结果证明当高频词取到第3位时便能与人工标引的关键词达到一半以上的匹配,在取到7位时便能在85%的程度上替代人工标引. 相似文献
9.
适用于隐含主题抽取的K最近邻关键词自动抽取 总被引:1,自引:0,他引:1
众所周知,K最近邻方法作为机器学习领域的一个经典的方法,在很多领域都有出色的表现.本文利用K最近邻方法的思想,提出了一种基于K最近邻的关键词自动抽取方法.现有的关键词抽取技术仅仅是对正文词汇的抽取,不能抽取隐含主题.隐含主题的抽取是关键词自动抽取技术的难点,但是该方法可以有效抽取隐含主题.该方法首先对数据进行预处理,使用向量空间模型将文本表述为数学化语言;然后,以人工标注关键词的文献数据作为训练集,使用K最近邻方法构建新文献的关键词候选集;最后,根据关键词本身的特点对候选关键词做了有效的后处理.实验表明,该方法不仅可以提高关键词抽取的准确率和召回率,还可以有效抽取文章的隐含主题. 相似文献
10.
针对中文自动标引过程中经常会产生诸多歧义词,导致检出的信息不切题或漏检这一问题,在论述自动标引中歧义词消除方法的相关研究基础上,提出一种将穷举法和消歧规则相结合的歧义词消除方法。测试结果表明,这是一种行之有效的消除歧义词的方法。 相似文献