首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
【目的/意义】为推动潜在“精品”文献识别及其在科技文献识别与传播利用领域中的应用。【方法/过程】以 国际顶级期刊Science和Nature期刊出版的论文及其引用分布数据为样本,统计出全部论文的首次响应时间、摘要 长度,总被引频次、资金资助、论文篇幅等特征,构建“精品”论文特征矩阵;然后基于“精品”论文特征矩阵和随机森 林算法进行潜在“精品”论文识别模型的训练与识别应用。【结果/结论】研究结果显示,融合“精品”论文特征矩阵和 随机森林模型能够较好地识别 Science 和 Nature 期刊中的潜在“精品”论文,模型正确识别分类的准确率均值达到 80%以上,其中Nature期刊的“精品”文献识别准确率高出Science期刊的“精品”论文识别准确率2%左右;使用信息 增益方法的模型识别效果比使用基尼不纯度方法的识别效果略好。此外,Science和Nature期刊“精品”论文的首次 被引速度极快,在出版当年即被引用。【创新/局限】“精品”文献特征矩阵和机器学习模型的结合能够较好地应用于 潜在“精品”论文的识别与推荐,然而未来需将模型推广应用于海量文献中“精品”论文的识别检验。  相似文献   

2.
【目的/意义】引用动机不同会导致一篇论文在多次被引用时的引用主题和重点产生差异,识别这些被引主题并分析其变化,有助于引用动机分析,提高文献推荐效果。【方法/过程】本文首先抽取被引文献的上下文语境信息,根据文本长度界定多种引用内容的划分范围;然后结合多种文本聚类方法,识别被引主题并比较其异同;最后通过时序比较,分析被引主题的演化路径和过程。【结果/结论】选取人工智能研究领域中的代表性高被引论文进行分析,发现前后句是对当前引用句的重要补充,引用句及其前后句组合能够更好地揭示被引主题;基于引用内容的被引主题呈现出多样化的特征,揭示了原文内容的扩展和引用动机的差异;被引主题演化分析能够有效地揭示原文内容被应用或改进的方向、主题、方法和技术。【创新/局限】形成基于引用内容聚类的文献被引主题识别及其演化分析框架,证明被引主题的差异化以及对原文的补充作用,同时揭示引用内容的主题时序变化的特征与现实意义,后续有必要扩大研究样本,使得研究结果具有更好的通用性。  相似文献   

3.
杨莉  熊泽泉  段宇锋 《情报科学》2019,37(10):60-66
【目的/意义】论文被引量在科研评价中具有重要地位,及早发现未来高被引论文或学者,将有助于科研人 员的管理与决策。【方法/过程】以图情领域期刊论文作为研究对象,采用相关性分析、方差分析、分位数回归分析、 模型拟合检验等方法,分析了期刊影响因子、作者数量、早期被引量、早期下载量等指标预测论文中长期被引量的 可行性及效果。【结果/结论】研究发现期刊论文的早期下载量与早期被引量是预测论文中长期被引量的有效指标; 分位数回归模型较一般线性模型在进行论文被引量回归分析与预测时更具合理性;论文早期下载量和早期被引量 一定程度上反映了其他指标的影响,其具有比期刊影响因子等指标更好的预测效果。  相似文献   

4.
【目的/意义】论文学术价值识别是科技成果评价的重要内容,利用论文内容贡献度和加权平均被引量指标 能够实现论文学术价值的早期识别,推动科技成果价值的早发现早实现。【方法/过程】本文首先基于模式匹配和共 现分析方法抽取了论文问题知识元关系和方法知识元关系;其次按照问题与方法知识元关系进行检索,构建问题 与方法相关文献集;然后基于相关文献集提出论文学术价值指标计算方法,并通过归一化贡献度-加权平均被引量 矩阵,实现了论文学术价值早期识别;最后采用图书情报领域期刊论文数据进行了实验研究。【结果/结论】实验结 果表明,本文提出的方法能够实现论文学术价值的早期识别,有利于推进高质量、高水平科技成果的推广与应用。 【创新/局限】后续研究将把更多论文知识元纳入计算,进一步提高论文学术价值早期识别效果。  相似文献   

5.
【目的/意义】对大数据知识领域的研究前沿及未来发展趋势进行预测。【方法/过程】利用引文网络结构变 换模型方法,通过 CiteSpace信息可视化软件工具,对下载于 Web of Science检索平台的大数据研究领域文献进行分 析,绘制文献共被引和引文结构变换知识图谱,分别从共被引文献和施引文献的视角,对大数据领域的研究前沿和 未来发展趋势进行预测。【结果/结论】预测出了对学科发展具有潜在影响力、交叉属性最强、对中心度影响最大的 文献以及相关研究主题。这种分析方法,避免了从施引文献或被引文献的单一角度分析知识领域研究前沿的不 足,对系统地分析知识领域的前沿,预测未来潜在变化趋势具有一定的参考价值。  相似文献   

6.
【目的/意义】为了解决新近发表文献大多零被引、被引多是自引的问题,本文基于论文所在期刊的复合影 响因子,对 p 指数改进,提出 pi 指数计算方法,用以合理有效地进行人才评价。【方法/过程】以图书情报学领域 2015—2016年的发文情况为例,运用 pi指数识别近两年该学科的主要贡献者,并分析 pi指数与 p指数、h指数的评 价效果;以图书情报学三位不同年龄段和不同发文情况的优秀学者为例,分析 pi指数对中高龄学者与年轻学者的 评价效果。【结果/结论】研究发现 pi指数在评价新近发表文献时,较 h指数、p指数表现出更好的评价效果,可用于 识别近期某研究领域的主要贡献者;另外 pi指数对优秀青年人才具有较好的识别能力,可作为一个较公平和客观 的人才评价指标。  相似文献   

7.
【目的】深入了解外语教育实证类论文的文献引用情况,为学术期刊影响力评价和学术论文写作教学提供参考依据。【方法】采用分层和随机抽样相结合以及人工核对的方法,分析了30篇国内高校学报刊发的外语教育实证类论文的337条文献的著录情况;探讨了共引同一文献的20篇论文的引文内容准确度及引证效果。【结果】文献著录错误较严重;且大部分引用有“引”无“证”,没有发挥引证的效用。【结论】文献著录错误,尤其是引证效果低下使学术期刊失去公信力,影响对学术期刊的客观评价。  相似文献   

8.
秦岩  代君  廖莹驰 《情报科学》2021,39(1):104-110
【目的/意义】研究学术会议论文新颖性测度方法,为会议论文的新颖性评价提供新的视角。【方法/过程】本 文设计吸收新颖性指标和产出新颖性指标测度方法,选择“人工智能”领域的会议论文进行实证研究。【结果/结论】 具有高吸收新颖性水平和高产出新颖性水平的论文成为A类会议论文的几率最高,结果表明新颖性测度方法的有 效性,对于会议论文的自动评审有一定的参考意义。【创新/局限】设计会议论文新颖性测度方法,促进会议论文评 价的发展;只针对计算机的人工智能领域进行实证,具有一定的领域局限性。  相似文献   

9.
【目的/意义】在国际政治经济环境和全球创新格局不断变化的背景下,拓展全球科技创新合作伙伴、建立更为广泛和紧密的全球科技创新合作网络,成为亟待解决的问题。【方法/过程】本文基于科技论文构建主题词共现矩阵,筛选二阶共现主题词对作为潜在国际科技合作主题对,通过定义主题对的国际合作潜力指数以及主题路径的国际科技合作路径强度指数,判定主题对的国际合作潜力并寻找有效的主题合作路径。【结果/结论】以中俄人工智能领域的SCI论文和CPCI-S论文为分析对象,通过对该领域潜在国际科技合作主题的识别和分析,证实本文所提方法的有效性。【创新/局限】本文提出一种识别潜在国际科技合作主题的方法,并利用中俄两国论文进行实证研究,但未考虑不同国家研究产出规模差异,未对关键词进行语义分析,需在后续研究中进一步探讨。  相似文献   

10.
罗建  廖婷  史敏  蔡丽君  李维思 《情报科学》2021,39(12):98-104
【目的/意义】诸多知名企业由于没有意识到新兴技术的发展趋势,忽略了未来可能对自身造成威胁的潜在 竞争对手,最终陷入破产境地。目前缺乏从新兴技术视角开展的潜在竞争对手识别研究。【方法/过程】在文献调研 的基础上,对潜在竞争对手识别的内涵进行分析,并构建新兴技术视域下潜在竞争对手识别流程。识别流程涵盖 预处理专利数据、新兴技术识别和潜在竞争对手识别三个步骤,涉及LDA主题模型构建、新兴技术指标体系建立和 技术知识存量计算等关键问题。【结果/结论】以智能驾驶领域为例,证明了基于新兴技术开展潜在竞争对手识别具 有一定的可行性,期望本方法能够为领先企业识别潜在竞争对手提供决策支持。【创新/局限】创新性地将新兴技术 识别与潜在竞争对手识别相结合,丰富潜在竞争对手识别理论与方法。  相似文献   

11.
张毅  李欣 《情报科学》2019,37(11):169-177
【目的/意义】将人工智能技术与可视化技术相结合,解析文章题名与摘要中包含的隐藏信息,为探索我国 图书情报领域的研究历史与现状提供全新研究视角。【方法/过程】从CNKI数据库中下载CSSCI来源期刊中图书情 报学领域的全部文章元数据148 956条,利用自然语言处理技术抽取题名与摘要中的标签、分类以及情感倾向,通 过统计、聚类、神经网络预测以及知识图谱等方法,绘制期刊下载与被引关系图、构建影响文献被引因素模型、研究 热点与情感倾向迁移图以及高质量文章的知识图谱等。【结果/结论】揭示了1957-2018年图书情报领域文献被引与 下载的关系,挖掘文献被引的影响因素,找出研究热点的变迁演化以及高被引文献的特征。  相似文献   

12.
【目的/意义】从国家和地区层面研究科技论文空间分布与地区差距的时空演变,有利于总结其发展规律, 对于优化科技资源的空间配置,缩小地区差距具有重要意义。【方法/过程】本文以图书馆情报与文献学CSSCI期刊 为例,基于中国知网CNKI引文数据,综合采用基尼系数、集中度、重心以及回归分析,研究了学科论文的空间分布 与地区差距的时间演化特征。【结果/结论】图书馆情报与文献学近年来论文总量有所下降,地区分布相对集中;论 文重心总体向西移动但南北变化较小;论文数量的地区差距早期较小现在保持相对稳定;论文期刊差距呈现“缩小 —拉大—缩小”的长周期变化;论文期刊差距对论文地区差距影响不大。【创新/局限】本文首次采用基尼系数、集中 度、重心等研究论文空间分布。  相似文献   

13.
鲁国轩  杨冠灿  宋欣 《情报科学》2022,40(9):154-158
【目的/意义】数字人文作为人文社科和计算机技术的跨界学科,在高速发展的同时面临概念界定不明确、 专题期刊缺乏等问题,增加了文献搜集难度。需要构建适合的识别分类模型,形成数字人文专题文献库,助力数字 人文研究。【方法/过程】分析数字人文学科的内涵,归纳数字人文文献特征,在人工识读标注的基础上构建机器学 习模型,实现对数字人文文献的自动识别与分类。【结果/结论】提出一种基于机器学习的数字人文文献识别分类模 型,对图情领域数字人文文献实现了较好的识别效果。【创新/局限】将机器学习算法应用到数字人文文献分类,较 好应对了词汇复杂和数据量较小的问题;进一步研究可使用深度学习等更复杂的模型,并实现不同领域数字人文 文献的多分类。  相似文献   

14.
【目的/意义】文献的向量表示方法对文献主题聚合、聚类和分类等研究具有重要意义。基于二元共现信息 的潜在语义向量空间模型(CLSVSM)挖掘了文本信息中词与词之间的潜在语义关系,与文本向量表示的基本模型- 向量空间模型(VSM)相比很大程度上提高了文本聚类的精度。【方法/过程】为使CLSVSM能更优的提取文献的潜 在语义信息,本文在二元CLSVSM基础上进一步引入了三元共现信息,以深度挖掘文献的潜在语义,通过研究三元 共现矩阵的表示,三元共现频次和相对共现强度的计算方法,最终建立了加权共现潜在语义向量空间模型(加权 CLSVSM)。最后我们分别利用中、英文献数据对二元CLSVSM和加权CLSVSM两类模型进行了实验比较。【结果/ 结论】结果显示:新模型对英文文献的聚类效果与二元CLSVSM相当,但对中文文献主题聚类效果明显要优于二元 CLSVSM。  相似文献   

15.
【目的/意义】基于Rao-Stirling 指数和LDA模型进行领域学科交叉主题识别,并以纳米科技为例验证将 Rao-Stirling 指数和LDA模型用于领域学科交叉主题识别的有效性和适用性。【方法/过程】基于Rao-Stirling 指数 测度领域文献学科交叉程度,设定阈值发现高度学科交叉文献。基于LDA模型对筛选出的学科交叉文献进行主题 识别,发现学科交叉点和学科交叉研究主题。【结果/结论】基于Rao-Stirling 指数从引文的角度进行领域文献学科 交叉测度可以有效地发现与某领域相关的学科交叉文献,且有利于大数据集的学科交叉文献发现研究的实现。基 于LDA模型进行学科交叉主题识别可以有效地发现学科交叉主题。两方法的组合应用为发现某领域学科交叉主 题研究提供一种新视角。  相似文献   

16.
【目的】回顾创办精品科技期刊的发展历程,分享和展望中文科技期刊的精品之路。【方法】 统计和分析《岩石力学与工程学报》历年特别是近10年发表较高水平的文章数与被引用情况、论文构成、发表论文Top 30单位与高被引论文前92名作者、办刊特点。【结果】分析表明设立“陈宗基讲座”引领岩土工程学科发展,本刊总被引频次和影响因子等各项指标提升明显。在此基础上进一步深化并拓展中文精品科技期刊的办刊思路。【结论】创精品科技期刊应该花大力气组约高水平稿件、注重严把审稿质量关、培养一流编辑将才和细化服务功能。  相似文献   

17.
【目的/意义】揭示不同文献类型的学科ESI高被引论文科研特征,更好地促进不同文献类型的高水平科学 研究,共同推动一流学科与高校建设。【方法/过程】利用Sci2 tool 、Pajek、Spss等对不同文献类型的图情领域ESI高被 引论文从年代产出、科学影响力、合作多样性、研究主题等展开比较。【结果/结论】该领域ESI高被引论文形成AR? TICLE与REVIEW不均衡二分天下的局面。ARTICLE拥有较低的入选频次,更多高影响力科研创新与分布式创 新,科研合作更加趋于多元化与分散化,研究主题共现网络扩张较为明显,主题内容主要分布在研究对象、计量指 标与理论基础等,研究更加聚焦于某些关键性问题。  相似文献   

18.
【目的】探讨将Altmetrics指标应用于掠夺性期刊识别的效果,为掠夺性期刊的识别提供新视角。【方法】基于Logit回归模型,分别构造仅含平均被引频次、仅含Altmetrics存在率指标以及同时融合这两个指标的3个掠夺性期刊判别模型,并通过ROC曲线对3个模型的拟合效果进行比较。使用邀请投稿邮件中的期刊数据对模型效果进行验证。【结果】同时融合平均被引频次和Altmetrics存在率的掠夺性期刊判别模型效果最优,两个指标与期刊掠夺性均显著负相关。以使用邮件邀请投稿的14种期刊数据验证发现,超过85%的期刊被识别为掠夺性期刊,说明模型的合理性。【结论】Altmetrics指标在掠夺性期刊的识别中具有良好的效果,为掠夺性期刊识别提供有益补充。  相似文献   

19.
刘阳 《情报科学》2023,(11):170-175
【目的/意义】本文旨在对当前信息资源管理领域数字人文研究成果进行系统性梳理,从时间、来源、热点等多个维度识别其研究内容及特征,为数字人文研究的进一步发展提供有益思路。【方法/过程】采用定量与定性相结合的研究方法对我国信息资源管理领域数字人文的研究成果进行系统性梳理,从时间、基金或机构资助、高被引论文及研究热点多个层面识别上述研究成果的内容及特征。【结果/结论】通过文献梳理发现,2012-2016年是发文量线性缓慢增长的起步阶段,2017年至今是发文量指数级大幅增长的快速发展阶段;基金或机构资助覆盖比例较高;高被引论文集中于数字研究基础理论、技术体系、研究趋向等议题;研究热点聚焦于技术应用、学科建设、项目实践与图书馆服务。【创新/局限】由于数字人文是跨学科研究领域,以信息资源管理学科为主要视角的研究对于全景式揭示数字人文研究图景存在局限。  相似文献   

20.
熊回香  李跃艳 《情报科学》2019,37(12):19-26
【目的/意义】学术网站是学者发现研究兴趣的有效途径,研究学者推荐与跨语言论文推荐有助于学者更好 地开展学术研究。【方法/过程】利用论文之间的引用与被引关系分别爬取参考文献集合和被引文献集合,构建学者 推荐与跨语言论文推荐模型。首先通过Word2vec算法模型生成候选相关学者集和候选相关论文集,计算 Word2vec得分;然后分别进行加权处理,最终得到学者推荐列表和跨语言论文推荐列表。以CSSCI中的《中国图书 馆学报》、《情报学报》和《图书情报工作》三种代表性期刊在2016-2017年载文的参考文献集合与被引文献集合为数 据来源进行实证分析,并验证模型的科学性与可行性。【结果/结论】实证结果表明,该模型可以很好地发现相关学 者以及相关论文。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号