首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 562 毫秒
1.
[目的/意义]技术路径识别能够得到表征技术发展的链接模式,挖掘技术方向及演变特征,对企业知悉技术路径发展有重要参考价值。[方法/过程]通过Web of Science和USPTO数据库对期刊文献和专利数据进行导出,利用Pajek软件分别构建期刊文献和专利引文网络;对引文网络进行社群划分,提取最大的社群网络进行主路径识别;对双源主路径节点文献构建文本相似性矩阵,利用文本相似性算法将前述路径进行融合与连接,全面揭示技术发展路径。[结果/结论]提出了一种基于期刊文献与专利双源引文网络和文本相似性分析的技术路径识别及融合方法,将该方法应用于无线充电技术领域,揭示了无线充电技术的发展主线,验证了所提方法的可行性与实用性,为相关企业明晰技术路径提供了科学的决策理论支持。  相似文献   

2.
[背景/意义]研究和对比不同主题建模方法在科学文献主题识别上的应用表现,对于合理选择使用主题建模技术开展科学文献主题挖掘具有重要意义。[方法/过程]通过构建中英文科学文献实验语料,选择3种主题建模方法(LDA、Top2vec、Bertopic)和5种文本特征计算方法(Bag of Words、TFIDF、Doc2vec、MiniLM、SciBert)进行中英文科学文献主题建模实验,并对不同建模结果的主题多样性、主题一致性、主题稳定性和主题离散性指标进行对比分析。[结果/结论]不同建模工具的主题识别结果存在较大差异,其中LDA与Bertopic在英文和中文语料上识别出的主题中具有相似性关系的主题占比相对较高,但也仅为9.81%和7.46%;基于Doc2vec算法的Top2vec模型在主题多样性指标上的表现相对最优;基于文本预训练算法的Top2vec模型和Bertopic模型的主题稳定性和离散性指标优于传统主题建模方法。针对大语言模型技术的快速发展和广泛应用,加快推进科学文献预训练模型研发,并将之应用于科技情报业务实践是当前的重要研究方向。  相似文献   

3.
郭剑明  王婧怡  周云峰  袁润 《情报杂志》2023,(5):162-168+191
[研究目的]综合考虑专利节点度数及其邻域专利节点对(node pair)间的相似程度,定义并计算专利节点在网络中的结构重要性,从网络科学视角完善专利价值评价与核心专利识别方法。[研究方法]基于专利四种基本引用关系构建专利综合引用网络;利用网络节点度数及其邻域节点对的相似度量化表征其局部网络结构重要程度,以此为依据提出专利节点重要性评价指标PNII,进行核心专利识别;从复杂网络视角,利用传染病传播动力学模型(SIR)计算专利节点的实际传播影响力,以此为判据比较PNII和其他网络中心性指标在不同传播概率和不同节点比例下的识别效果。[研究结论]结果表明,基于专利网络节点重要性的PNII指标相较一般的网络中心性指标更加科学,核心专利识别结果更加准确;基于传染病传播动力学模型的评价方法,在一定程度上解决了核心专利识别结果评价难题。  相似文献   

4.
刘冰  庞琳 《情报理论与实践》2021,(3):172-177,163
[目的/意义]从用户角度,通过用户评价内容挖掘构建形成网络学术信息资源评价模型,为网络学术信息资源评价提供一个新的视角,并为其更进一步深入研究奠定基础。[方法/过程]文章在利用爬虫工作自动抓取三个知名学术网站用户评论的语料库基础上,运用数据挖掘研究方法对评论数据进行分词、聚类,根据词间与词对关系,构建形成评价体系模型。[结果/结论]基于用户评论挖掘构建形成涵盖资源内容属性、资源外部特征、网络功能属性、获取过程、用户体验五个维度的网络学术信息资源评价体系模型。该体系模型反映出科学用户在利用新兴网络学术信息资源过程中对资源自身属性和平台规范性的关切,是用户与利用正式学术信息资源的本质区别。  相似文献   

5.
[目的/意义]设计了一种基于语义内容的论文创新性事前测度方法,揭示论文创新性与学术影响力之间的关系及其机理。[方法/过程]将单篇论文创新性分为新颖性和常规性两个特性;通过Word2Vec模型训练关键词向量,融合关键词语义计算论文新颖性及常规性;进一步结合统计回归分析方法分析了论文创新性对被引次数的影响。[结果/结论]以WoS收录的自然语言处理研究论文为对象进行分析,结果表明:(1)文章提出的论文新颖性和常规性的测度方法充分考虑了文本语义,在论文发表之初就可以获得其创新性评价结果,且创新性得分结果相对合理;(2)回归分析结果表明,科研论文越新颖其被引次数越少;(3)在新颖性相同的情况下,科研论文的常规性越高则被引次数越多,常规性对论文被引次数的影响程度相对于新颖性更强;(4)引文影响力更适用于高常规化科研领域的评价问题。  相似文献   

6.
[目的/意义]大多数社交网络节点的影响力计算没有考虑用户的评价,而用户评价对特定领域的专业影响力节点的识别具有重要意义。[方法/过程]本文利用领域字典和话题识别模型将目标用户的主题范围进行限定,同时结合社交网络用户中的个人信息综合指标,基于用户关注关系建立链路网络,并充分纳入用户评论的情感评分,提出针对专业影响力节点挖掘的Domain Rank算法。[结果/结论]研究表明,该算法能够有效的从多主题的用户群体中发现和识别潜在的专业影响力节点。  相似文献   

7.
温芳芳 《现代情报》2018,38(7):142-147
[目的/意义]企业间的技术相似性能否转化为现实的合作关系,专利耦合所揭示的潜在关联究竟预示着合作还是竞争,这些问题需要在实证研究中寻找答案。[方法/过程]以德温特专利分类号为媒介构建专利耦合网络,采用可视化和因子分析方法考察企业的技术相似性及其聚类结构、发掘技术派系及其研究方向,对专利耦合网络与现实合作网络进行比较。[结果/结论]单纯的技术相似性不能作为潜在合作关系的有效判定依据,基于专利耦合形成的潜在合作关系难以转化为现实,社会关系因素对于专利合作的影响程度远甚技术相似性。  相似文献   

8.
张理  魏奇锋  顾新 《现代情报》2009,40(2):122-131
[目的/意义] 面向科研合作网络中的学术社群,提出基于合作者吸收能力的知识扩散种子选择方法,以提升社群知识扩散效率,促进社群成员知识吸收。[方法/过程] 运用R软件完成仿真实验。基于斯坦福大型网络数据集(SNAP)的真实科研合作网络数据,运用社团检测算法"WalkTrap"检测出学术社群。将各学术社群中合作对象吸收能力总和最大的节点作为各社群的知识扩散种子,基于此,在各社群内部实施知识扩散仿真实验,并用其余4种基于网络中心性的方法与本文方法作对比。[结果/结论] 基于合作者吸收能力的种子选择方法,在网络整体知识水平、知识水平分布均匀性与扩散初期的知识增长速度等方面均优于其它4种方法,且节点吸收能力差异越大,这种优势就越突出。节点平均吸收能力越强或网络中节点平均度越大,知识扩散效率受种子选择方法的影响越小。  相似文献   

9.
科研合作网中节点重要性评价方法及实证研究   总被引:1,自引:0,他引:1  
科研人员的学术评价问题可以建模为科研合作网络中节点重要性的测度问题。用学术期刊论文的作者信息构建了作者科研合作网络,在此基础上,通过计算网络中节点的权值来评价作者的学术贡献,通过计算与该节点相连的边的权值来评价作者的科研产出能力,最后通过对节点和边的综合考察来判断节点的重要性。实证分析表明,用所提方法进行节点重要性测度,即对科研人员进行学术评价,结果符合实际情况。  相似文献   

10.
[目的/意义] 多主题覆盖的枢纽节点群能够快速"导航"至领域更多主题的高被引综述文献和权威节点,从而可以使新领域工作者短时间全面了解领域已有研究、现状和未来发展趋势。[方法/过程] 本文提出一种节点群发现算法——HubsRank算法,该算法基于引文网络中节点影响力(信息、知识)的传递,通过多轮迭代,得到引文网络中多主题覆盖的枢纽节点群。[结果/结论] 最后,与HITs算法进行实证对比分析,本算法能更快、全面地提取枢纽节点群和不同主题的高被引权威节点,且该算法可以有效避免主题集聚效应。  相似文献   

11.
[目的/意义]已有研究大多是通过频次研究关键词的热点程度和分布,较少有研究综合考虑多个维度的属性,对关键词的重要性进行考量。从词汇或词组集合中识别出重要关键词,有助于研究者把握学科领域的重点内容,为科研选题、确定研究内容等提供决策支持。[方法/过程]首先,通过理论分析,引入RFM模型,提出关键词重要性概念模型和指标体系;其次,构建特征数据集,参考Glo Ve词向量模型的思想,通过共现矩阵提取关键词的特征向量;再次,使用关键词重要性概念模型提取分类标签,对数据进行自动化标注;最后,通过人工智能相关算法进行模型训练和验证,证明提出的识别方法的可行性。[结果/结论]模型训练和评估,SVC算法的F1值达到0.79,Bi LSTM模型的F1值达到0.87,具有较好的拟合效果,说明提出的重要关键词识别方法具有可行性。[创新/局限]研究的创新点在于提出了具有多维度属性的关键词重要性概念模型和指标体系,并在深度学习模型上得到较好的评估结果;局限之处在于需要进一步扩大数据量,选择更多学科领域的数据对关键词概念模型进行验证,这是进一步研究的重点。  相似文献   

12.
[目的/意义]大科学时代,跨学科合作日趋普遍,准确把握跨学科相关知识配对成为跨学科合作研究的前提。基于学术社交媒体弱关系结构识别跨学科相关知识组合,一方面有利于科研人员选择跨学科研究方向;另一方面也是对科学文献数据识别结果的补充。[方法/过程]以科学网为样本来源,以图书情报学科为例进行实证研究。首先,通过用户好友链接关系,构建目标学科用户—跨学科好友用户关系网络;其次,基于学者博文筛选能够代表学者主要研究对象、问题或方法的研究主题作为知识节点,基于好友关系构建目标学科知识节点—跨学科相关知识弱关系网络;最后,构建合作潜力模型,识别最佳跨学科相关知识配对。[结果/结论]识别发现“高被引论文—生态学理论”“科研合作—波士顿矩阵”等是图书情报学跨学科合作知识组合,并分析它们的合作可能性与合作方向,验证模型的可行性与有效性。  相似文献   

13.
[目的/意义]遵循FAIR原则构建标准化、结构化的循证医学文献数据本体表达模式。[方法/过程]采用NeOn本体建立方法,通过本体构建工具Protégé4.0进行本体的设计与构建。以科学证据及来源信息本体(SEPIO)为主要框架,同时参考已有生物医学本体,如副作用本体(OAE)、药物本体(DRON)、疾病本体(DO)等,构建了循证医学文献本体(Evidence-Based Medicine Ontology, EBMO)。[结果/结论]EBMO目前包括58个类、13个对象属性和11个数据属性。以哮喘药物治疗随机对照试验文献为实例进行录入验证,证实依据EBMO著录的实例可实现文献证据强度以及诊疗信息的推理。研究构建的循证医学文献本体能够更好地组织、利用和呈现循证医学文献信息的内部特征,为循证医学数据库和语义网的建立奠定良好的基础。  相似文献   

14.
[目的/意义]通过实验分析不同特征提取算法对新闻文本聚类效果的影响。[方法/过程]选取搜狗实验室的搜狐新闻语料库以及澳大利亚广播公司2003-2017年间的新闻标题语料库,对TF-IDF、Word2vec以及Doc2vec三种单一特征,TF-IDF+Word2vec、TF-IDF+Doc2vec、Word2vec+Doc2vec以及TF-IDF+Word2vec+Doc2vec四种组合特征在K-means、凝聚以及DBSCAN算法上分别进行聚类分析,通过Purity以及NMI两个评测指标对聚类效果进行评价。[结果/结论]单类特征中三个特征的聚类质量呈Word2vec> TF-IDF> Doc2vec关系;组合特征中TF-IDF+Word2vec的效果最优。Word2vec在单一特征中的表现最优,其也是不同组合特征间差异的主要因素,特征组合是否可以提升聚类性能需基于多因素进行综合判定。  相似文献   

15.
王新明  丁敬达 《现代情报》2018,38(8):172-177
[目的/意义]研究科研论文的著者合作模式有助于发现科研合作中存在的合作关系以及评价不同合作模式的科研绩效,为进一步的科研合作提供方法和参考。[方法/过程]从作者属性和科研众包的视角对科研论文的著者合作模式的相关研究进行梳理和归纳。[结果/结论]基于作者的机构、地域、年龄、性别、职称、研究方向等属性和科研众包对科研论文的著者合作模式的研究进行归纳和论述,并提出未来可能的研究重点:著者合作模式综合视角下的科研绩效评价;作者贡献声明视角下的著者合作模式及合作规律研究。  相似文献   

16.
[目的/意义]针对技术功效图构建过程中的主要问题和薄弱环节,提出了一种基于SAO结构和词向量的专利技术功效图构建方法。[方法/过程]利用Python程序获取专利摘要中的SAO结构,从中识别技术词和功效词;结合领域词典与专利领域语料库,运用Word2Vec和WordNet计算词语间的语义相似度;利用基于网络关系的主题聚类算法实现主题的自动标引;采用基于SAO结构的共现关系构建技术功效矩阵。[结果/结论]实现了基于SAO结构和词向量的技术功效图自动构建,该构建方法提高了构建技术功效主题的合理性和专利分类标注的准确性,为技术功效图的自动化构建提供新的思路。  相似文献   

17.
[目的/意义]21世纪互联网技术的发展为学术研究提供了开放的交流平台,科研信息资源由此呈指数增长,学者难以从繁杂的信息中快捷获取所需信息,从而导致学术资源利用率低下。学术资源精准化、个性化推荐,成为了提高学术信息流转效率和实现价值增值的有效途径。[方法/过程]本文利用文献发表时间因子与文献语义相似度对异质信息网络进行加权,并基于此加权网络采用Node2vec进行有偏随机游走生成图节点序列,然后利用Skip-gram语言模型进行序列学习,最终计算节点向量的相似度以实现学术信息推荐。[结果/结论]以CNKI中的数据集为例对本文所提出的模型进行验证,实证结果表明,使用该模型推荐的论文与学者,一方面与目标学者的研究方向相符合;另一方面在时间维度上也较为精准,能够有效满足学者信息需求。  相似文献   

18.
[目的/意义]揭示不同年龄的参考文献对促进知识创新的作用规律。[方法/过程]以物理学2006年发表的SCI论文为例,计算每篇论文在D算法、Rela_DZ算法和DZ算法3种算法下的颠覆性指数,综合运用统计描述和线性回归、分位数回归,从参考文献年龄的跨度和多样性两个方面,研究科研论文颠覆性与参考文献年龄之间的关系。[结果/结论]参考文献年龄跨度和多样性都对科研论文的3种颠覆性指数有负向影响,但是所有回归分析的结果中3个模型的拟合R2都偏低,但结论一致,即参考文献年龄对科研论文颠覆性指数的影响并不明显,因此操纵参考文献年龄的非科学引用并不会影响颠覆性指数的评价结果。  相似文献   

19.
吴树芳  杨强  侯晓舟  尹萌 《情报杂志》2023,(11):119-125
[研究目的]引导式主题模型可以引导生成有倾向性的敏感主题,提高网络敏感信息识别性能,对维护国家安全和社会稳定具有重要意义。[研究方法]针对当前网络敏感信息识别研究构建敏感信息特征不全面和不准确,从而导致识别性能欠佳的问题,提出基于SSI-GuidedLDA模型的引导式网络敏感信息识别方法。首先,从多源网络资源中爬取敏感种子词,并基于词向量模型Word2Vec获得种子词的敏感语义相关词,构建更为完备、准确的敏感特征。其次,将构建的敏感特征融入引导式主题模型,得到改进后的模型SSI-GuidedLDA。最后,基于SSI-GuidedLDA模型获得待识别信息的主题分布,通过主题分布概率判断其是否为网络敏感信息。[研究结论]在新浪微博数据集上的实验结果显示,与已有方法相比,提出的方法在准确率、召回率和F1值上均有一定提高。  相似文献   

20.
刘春丽  陈爽 《现代情报》2023,(12):143-163
[目的/意义]科学文献中的知识实体的挖掘、利用与评价对知识发现、构建知识网络、探索知识之间潜在关联均具有重要意义。随着机器学习、深度学习和大语言模型的发展及其应用,相比最早的基于人工标注的知识实体抽取技术,如今已经发生了翻天覆地的变化;此外,近年来,学者对科学文献中知识实体的评价也进行一些探索,取得了较大进展。[方法/过程]在相关文献调研基础上,回顾并比较了基于人工标注的方法、基于规则的方法、传统机器学习、基于深度学习与大语言模型在知识实体抽取方面的优缺点,列举了相关数据集、软件与工具及相关专业会议;从提及频率、替代计量及其影响因素、实体共现网络及实体扩散/引文网络、基于知识实体的同行评议、基于知识实体的论文新颖性和临床转化进展五大方面,对知识实体的评价研究最新进展进行了归纳与整理。[结果/结论]针对目前存在的问题,建议在具体的知识实体抽取任务中,抽取方法选择应权衡多方面因素,再依此选择一个或多个模型完成实体抽取任务;在知识实体评价方面,应重视指标多样化、可靠性、有效性、系统性和规范化研究,关注对知识实体评价指标的影响因素、指标间相关关系与因果关系的实证分析,构建基于知识实体的论文评价...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号