首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
孟旭阳  白海燕  梁冰  王莉 《情报杂志》2021,(3):125-131,7
[目的/意义]资源数字化时代文献服务向知识服务方向转变,高质量的文献自动标引是文献知识服务能力提升的基础和关键,针对目前英文科技文献自动标引准确率不高的问题,提出了基于语义感知的概念遴选优化方法。[方法/过程]基于知识组织系统的自动主题标引,采用自然语言处理中的神经网络词向量技术,对概念和英文文献内容语义进行表示并进行语义感知与评估,实现概念标引结果在语义层面的遴选。该方法采用基于知识组织系统与自然语言处理技术相结合的方法,弥补了在语义层面上的不足,从而进一步降低不相关概念的影响,提高概念标引结果的准确率。[结果/结论]实验结果表明,该方法具有较好的语义感知性能,在概念遴选上有效降低了不相关概念,大大提高了标引结果的文献相关性,为科技文献资源知识化服务建设和相关研究提供有价值的参考和支持。  相似文献   

2.
【目的/意义】基于文献数据的领域知识图谱构建有助于探测某学科领域的主要研究内容及其发展方向,是 进行技术创新的基础情报工作,对于研究人员、企业都具有一定的意义。【方法/过程】提出基于交互式可视化技术 的知识图谱构建方法,首先基于经典LDA模型进行主题识别,然后基于社会网络分析方法构建领域主题网络识别 关键主题词;最后,基于JS(D3 工具)绘制可交互的关键主题词关联与检索知识图谱,发现关键主题词的隐含联系, 辅助进行领域知识挖掘与分析。【结果/结论】通过对我国医疗健康信息领域进行实证研究,验证了本文提出方法的 准确性和有效性。  相似文献   

3.
靳从  唐振民  杨静宇 《情报科学》2004,22(3):337-339
自动标引是计算机文献管理中的一个重要过程。主题词的切分是自动标引的第一步,一般标引词均有标准主题词库,而自然主题词千差万别,使切分有一定的困难。本文利用自然主题词的特点,给出了一个基于自然主题词基本结构的切分方法,先使用相关信息对自然主题词的可能起始部分进行判断,再根据约束条件对自然主题词的整体进行判断,同时根据其出现的频率及位置施以加权处理,从而得到正确完整的自然主题词。通过标引系统的标引结果证明了方法可行。  相似文献   

4.
从关键词与高频词的相关度看自动标引的可行性   总被引:1,自引:0,他引:1  
本文通过基于词频统计的内容分析法,将从文本中抽取的高频词与关键词进行匹配对比;根据抽样实验的结果分析了二者的相关度,并以此为基础论证了文献主题自动标引的可行性;结果证明当高频词取到第3位时便能与人工标引的关键词达到一半以上的匹配,在取到7位时便能在85%的程度上替代人工标引.  相似文献   

5.
[目的/意义]旨在为学习者、教学者、平台管理者决策提供支持。[方法/过程]从学习者、教学者、平台管理者需求出发,设计了慕课课程评论可视化分析系统的框架,并通过Python语言对各模块进行实现。[结果/结论]设计与实现的慕课课程评论可视化分析系统通过对课程评论相关信息的自动化统计,能够直观展示出慕课课程常规数据的可视化以及基于课程评论的主题发现可视化。  相似文献   

6.
[目的 /意义]专利文献是一种集技术、经济、法律三种情报为一体的文件资料,蕴含着丰富的具有价值的信息,挖掘高价值专利信息为评估该领域专利的维持与放弃、专利成果转化、专利管理,以及帮助企业掌握行业内专利发展状况、考察潜在市场,为制定企业专利战略和发展战略提供支持。[方法 /过程]本文以自动驾驶技术领域为例,利用专利挖掘工具,以可视化的方式展示,挖掘其技术、经济、法律高价值专利信息进行实证分析。[结果/结论 ]自动驾驶是近几年新兴发展起来的技术,在技术领域上有较多的突破和应用,但由于其中大量专利申请时间不长,进入市场的时间较短,成果转化还有待进一步发展,另外在专利布局和保护上同样需要进一步加强。  相似文献   

7.
[目的/意义]随着我国关于政策文本研究文献的日益增多,对国内CSSCI期刊发表的相关研究文献进行综合述评有助于梳理政策文本分析研究的脉络,为未来政策文本研究的深入提供参考。[方法/过程]基于文献计量学和可视化分析视角,绘制我国政策文本研究的作者共现图谱、机构共现图谱、关键词共现图谱、关键词聚类图谱、关键词突变图谱等。[结果/结论]可视化地呈现了我国政策文本研究中具有影响力的作者及科研机构间的合作情况,通过分析关键词共现、聚类、突变情况以揭示政策文本研究发展脉络,并对研究方法、研究视角与研究领域进行总结。  相似文献   

8.
[目的/意义]基于科技文献构建问题—方法矩阵,探索科技文献研究内容新颖性评估方法,辅助科技查新应用。[方法/过程]对科技文献内容进行信息抽取,提取研究问题和方法内容文本并构建问题—方法矩阵。利用LDA模型对科技文献采用的问题与方法进行分类,将科技文献在问题—方法矩阵中定位并可视化。通过设定阈值划分区域,确定待评估科技文献研究问题和方法所在区域,进行新颖性评估分析,并通过实验验证该方法的有效性。[结果/结论]提出的基于问题—方法矩阵的文献新颖性评估方法通过可视化方式不仅有利于辅助科技查新判断,还可服务于创新选题。[局限]基于科技文献的研究问题与方法信息抽取和新颖性评估计算的自动化方法有待进一步研究。  相似文献   

9.
汉语文献自动分词与标引研究综述   总被引:3,自引:0,他引:3  
湛述勇 《情报科学》1992,13(5):66-71
本文根据近年来国内发表的有关自动分词与标引的部分文章,对汉语文献自动分词方法和自动标引技术进行了分析和归纳,并提出了自动标引质量评价和标引模型评价指标的问题。  相似文献   

10.
网络信息检索系统中信息自动标引方法的设计与实现   总被引:1,自引:0,他引:1  
周晓红 《情报杂志》2005,24(12):41-43
比较了目前主要使用的标引方法,根据网络信息的特点,提出了关键词标引和全文标引相结合的混合标引方法,并给出了具体实现方法,描绘了自动标引的流程图。最后给出了信息标引处理后数据检索方法。  相似文献   

11.
针对传统主题检索系统的弊端,提出了包括全文主题词标引、概念标引、检索式语义分析、概念扩展、模式匹配、基于汉字相似度的主题词联想等相关技术,使用这些技术可以发挥主题检索和自然语言检索各自的优点,使传统主题检索系统成为智能化、高层次的信息检索系统.  相似文献   

12.
一个基于本体论全文自动标引方案   总被引:5,自引:1,他引:5  
王泰森 《情报科学》2003,21(9):950-952
本文为支持数字图书馆全文检索精度的提高,提出了一个基于本体论全文自动标引方案。该方案利用本体论的方法,强调词与词之间的内在概念联系,着重解决传统的人工标引不能全面概括全文,而且词与词之间缺乏概念性的连接,很难反映文件主题的全面内容及由于多义词、同义词等的原因造成漏检或检索结果返回信息太多,失去检索意义,达不到理想效果的问题。并为数字图书馆在进行主题标引时实现自动化操作。  相似文献   

13.
[目的/意义]针对海量科技文献新颖性评估需求,从科技论文研究问题与方法视角出发,利用科技论文摘要与相关引文文本,构建科技论文的评述画像,用于辅助科技论文新颖性评估。[方法/过程]提出一种综合“自评+他评”内容的科技论文评述画像方法。该方法基于期刊论文结构化摘要文本解析问题和方法等句子,以单篇期刊论文为目标文献,将施引文献中引文句子作为引文数据集并分类后,可视化呈现科技论文的自评和他评内容。目前科技论文评述画像分为两种:一是按照引用问题与方法等分类并可视化,二是按照自引他引及情感分析进行分类可视化。[结论/结果]构建的科技论文评述画像能够从论文作者与引文作者的双重视角综合展示目标论文的研究成果,结合自引他引及情感分析信息可有效辅助科技论文新颖性评估。  相似文献   

14.
学术论文关键词的概念及标引方法辨析   总被引:2,自引:0,他引:2  
回顾了学术论文关键词标引的研究成果,指出了存在的问题:关键词概念模糊,标引方法不一致。依据我国相关标准,对学术论文关键词的概念及其标引方法进行了辨析,认为,关键词既不完全是人工语言,也不完全是自然语言,它是从报告、论文中抽取,并经过规范化处理,能反映全文主题内容的单词或术语,学术论文关键词标引步骤应为:文献审读、文献主题分析并抽词、规范化处理、标引结果审校等。并探讨了关键词与标题词、自由词及主题词的关系,以及关键词标引与主题词标引的区别,以加深对关键词概念及其标引方法的理解。  相似文献   

15.
文章介绍自动标引技术的发展现状,并将自动标引技术应用于政府信息公开的标引工作中,针对政府信息公开工作中存在的问题和不足,运用统计加权算法,将词频统计、位置加权、词共现统计三者相结合,设计实现了基于关键词的政府信息公开的自动标引。  相似文献   

16.
同时分析科学与技术在时间和内容上的互动关系可以具体揭示二者关联规律,但目前缺乏相关研究,同时难以发现领域内核心主题。鉴于此,提出一种识别科技演化模式的方法,利用搜索路径节点对算法分别对科学文献和专利文献提取全局主路径,通过潜在狄利克雷分配主题模型并结合专家意见进行文本挖掘,提取科学研究与技术研究的重点主题,并基于主路径分析结果分别形成科学文献和专利文献的发展路径时间轴,通过计算主题间余弦相似度来衡量相似主题;此外,对科学文献与专利文献的相似主题基于主题词共现词频进行连接,以桑基图的形式呈现,从主题的角度识别科学与技术的关系,探讨领域内科学与技术之间的互动模式,并在此基础上综合考量科学与技术价值、挖掘核心技术。基于基因工程疫苗领域的实证结果显示,该领域大体上呈现科学研究和技术应用相互促进的模式,基因工程的基础技术发展促使基因工程疫苗可以应用于多种疾病领域,特别是抗感染领域,mRNA疫苗是新的研究热点。  相似文献   

17.
[目的/意义]为帮助用户在拥有海量文本信息的问答社区高效率、高质量定位到符合自身需求的信息。[方法/过程]本文提出基于主题特征的问答文本摘要生成模型,该模型融合Word2Vec和SLDA算法多层次表达问答文本语义特征,而后基于图排序的思想,结合MRR冗余控制算法与文本句特征标签,调整句子权重,高效筛选出贴合问题标签的摘要内容。[结果/结论]本文对知乎问答社区多个问题下的问答文本数据进行验证,结果证明该模型具有较高的可行性和有效性。但本文选取了500份回答文本数据进行实证,未来可进一步扩大数据量开展更为充分的验证。  相似文献   

18.
[目的/意义]旨在解决高校专利管理和运营转化对信息的需求,弥补现有专利数据库的不足,提出更为全面的高校专利数据标引模型,为专利分级分类、专利价值评估提供数据支撑.[方法/过程]从高校管理运营需求出发,采用对比研究、文献调研、问卷调查等方法,提出基于管理、技术价值、法律价值、市场价值、战略价值五个维度的标引字段体系,结合...  相似文献   

19.
张铧予 《现代情报》2010,30(12):22-24,35
在现有的大规模的文献信息资源中发现知识与知识之间的关系,有利于新知识的发现,因此基于文献的知识发现成为很多学者关注的热点领域。而将文献资源的特点和主题显性地表示出来,则需要标引的支持。标引的质量与效率直接关系到知识发现的效果,由此可见标引是制约知识发现及其发展的瓶颈,同时也是知识发现的基础。本文首先对目前主要的基于文献的知识发现方法及其所涉及的资源标引的方法进行研究,从中发现标引对知识发现的制约因素,并提出相应的改进方向。  相似文献   

20.
可视化竞争情报的提取   总被引:1,自引:0,他引:1  
根据竞争情报的特,最,并借助于迅速发展的文本挖掘和信息可视化思想和技术,提出了基于文本挖掘的可视化竞争情报提取系统,并对其中所涉及到的文档收集、文档预处理、文本挖掘和信息可视化等关键技术进行了讨论。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号