首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 468 毫秒
1.
作者重名辨识研究进展   总被引:1,自引:0,他引:1  
作者重名现象将降低文献检索和网络检索的准确性,影响文献数据搜集质量,增加基于作者个人层面分析评价的障碍。目前国内外学者提出了人工辨识、数据库字段修正、基于机器学习的重名辨识等多种方法来解决作者重名问题。文章总结作者重名辨识面临的问题,分析当前各辨识方法的特点以及不足之处,指明作者重名辨识特别是中国作者重名辨识的发展方向。  相似文献   

2.
基于概率主题模型的文献知识挖掘   总被引:1,自引:0,他引:1  
对海量的科技文献资源进行知识挖掘能够发现大量有价值的、潜在的知识,有效地提高文献信息的可用性。作者前期研究验证了使用LDA主题模型进行文献知识挖掘的可行性。本文提出了一种新的概率主题模型:Topic-Author模型,该模型对文献的文本信息和作者信息进行联合建模,在分析文献主题同时,发现相关主题方向的研究者分布。基于Topic-Author模型,提出了多维度文献知识挖掘的方法,包括主题挖掘,专家发现,文献标注,重要文献挖掘,文献相似度分析,研究趋势分析和主题关系挖掘。基于教育技术学文献数据集,进行了实验研究。  相似文献   

3.
针对面向结构特性的科技文献分类问题,通过关联规则的分类方法将科技文献划分为不同的类型:综述型、理论型和应用型。首先对科技文献数据分词等进行预处理;然后通过PredictiveApriori关联算法挖掘关于类别特征项的频繁项集,构造科技文献分类的分类器;接着对分类科技文献进行分类规则匹配,判定所属类别;最后通过实验对分类性能进行评估,并通过对比证明了本方法的有效性。  相似文献   

4.
社会网络分析方法在图情领域合著关系的实证研究   总被引:7,自引:0,他引:7  
本文首先构建了图情领域的作者合著网络,并将该网络与国外其他学科的合著网络进行比较分析,发现目前图情领域的合著交流并不充分,提出需要进一步加强交流与合作。随后,构建了图情领域核心作者的合著网络和web合著网络,并对两个网络进行了简单的比较分析,指出可以通过使用web合著网络近似模拟学术合著网络进行社会网络分析,解决web合著中的文献重复消岐和作者重名消岐问题。  相似文献   

5.
文献数据库中书目信息共现挖掘系统的开发   总被引:9,自引:0,他引:9  
针对权威的生物医学数据库和引文索引数据,介绍一个基于文献数据库中书目信息共现关系进行文本挖掘的系统。该系统具有基本的文献计量学分析功能,并对相应的结果进行可视化表达;对高频主题词、高产作者和高被引论文和高被引作者进行共现分析,据此进行聚类分析和关联分析,获得有关的研究主题聚类和主题词/副主题词关联规则、合著聚类分析、高被引论文同被引聚类分析和高被引作者同被引聚类分析的结果和可视化表达。其中对关联规则的分析可以发现主题词之间的潜在语义规则,其他的文献计量学指标和共现分析结果可以用于科学计量学的分析。  相似文献   

6.
关于文献关键词标引问题   总被引:1,自引:0,他引:1  
对文献关键词标引问题进行了论述.指出了科技文献关键词标引中的一些误区,提出了文献作者和科技期刊编辑人员在标引关键词时的规则和注意事项.同时,还指出了关键词标引对文献存储和检索的重要作用.介绍了关键词和主题词的关系.  相似文献   

7.
面对海量的科技文献资源,如何评估文献、作者和研究机构的学术质量和可信度引起了广泛关注。在众多可信度评价标准中,权威度是优先和关键的评价指标。因此,对科技文献、作者和机构等学术实体的科技实力和权威度进行研究与量化评估具有很大的现实意义。本文利用文献、作者、机构等三类实体间的引用、合著、合作等关系建立异构网络模型,在此基础上提出了混合随机游走算法 Co-AcademicRank 定量计算文献、作者、机构的权威度,并基于 MapReduce 实现了分布式的 Co-AcademicRank 算法。最后通过对情报学和图书馆学数据集测试与分析,对比分析了 PageRank 和 Co-ranking 算法,验证了本模型的有效性、准确性和优越性。同时,实验比较了算法在单机环境下和 Hadoop 平台下的运行时间,证明了分布式算法的高效性和稳定性。  相似文献   

8.
提出将关联规则方法应用到微群核心用户挖掘中,选取新浪微群作为具体实验对象,分别利用关联规则方法、主流的社交网络方法和常用的评价指标体系方法对采集到的真实微群数据集进行对比分析,验证模型的有效性。同时发现常用的评价指标体系方法需要根据微群的具体问题进行调整,而关联规则方法可自动处理,说明关联规则方法具有普适性。  相似文献   

9.
设计一个可以自动识别古代汉语文献中姓名的模型系统,对纪传体古代汉语文献中的姓名识别作了实验和探索。以晋陈寿的《三国志·蜀书》十五卷为实验文本,对系统的识别效果进行测试,识别结果为召回率75.4%,准确率91.9%。实验证明,基于规则的方法对于识别纪传体古代汉语文献中的姓名是可行的。  相似文献   

10.
图书馆编目规则的应用现状及问题分析   总被引:2,自引:0,他引:2  
本文对文献编目规则在图书馆编目中的应用现状及存在的问题进行探讨,对具体编目实例进行对比分析,并提出提高书目数据质量的若干建议.  相似文献   

11.
There are a number of solutions that perform unsupervised name disambiguation based on the similarity of bibliographic records or common coauthorship patterns. Whether the use of these advanced methods, which are often difficult to implement, is warranted depends on whether the accuracy of the most basic disambiguation methods, which only use the author's last name and initials, is sufficient for a particular purpose. We derive realistic estimates for the accuracy of simple, initials-based methods using simulated bibliographic datasets in which the true identities of authors are known. Based on the simulations in five diverse disciplines we find that the first initial method already correctly identifies 97% of authors. An alternative simple method, which takes all initials into account, is typically two times less accurate, except in certain datasets that can be identified by applying a simple criterion. Finally, we introduce a new name-based method that combines the features of first initial and all initials methods by implicitly taking into account the last name frequency and the size of the dataset. This hybrid method reduces the fraction of incorrectly identified authors by 10–30% over the first initial method.  相似文献   

12.
根据参考文献著录实践,探讨《信息与文献参考文献著录规则》(GB/T 7714-2015)值得改进的地方,如保留责任者著作方式,增加责任者的国别、朝代信息,在著录符号中增加分隔符“·”,在电子文献“获取和访问路径”中增加网站名。参考文献著录规则的修订不仅要考虑科学性向度,也要考虑人文性向度;只有科学性、人文性结合得好,才能展现出参考文献著录规则的实用性价值。  相似文献   

13.
赵捷  贾君枝 《图书情报工作》2017,61(22):134-139
[目的/意义]名称规范档在书目数据库中对书目记录的检索点进行规范化校验,通过实现标目的一致性,达到检索效率提升、目录汇集的目的。分析国外名称规范档的最新研究进展及实践,以期为中文名称规范档的发展研究提供借鉴。[方法/过程]通过对当前中文名称规范档建设存在的问题进行客观分析,结合国外名称规范档的研究进展及实践,提出中文名称规范档的建设发展方向。[结果/结论]当前中文名称规范档的建设存在着数据规模小、数据完全性差、数据共享性低问题,从国外名称规范档的发展看出,其不再局限于图书馆内部建设,开始向合作共建共享发展,规范数据不再面向OPAC系统,向开放互联发展。因此中文名称规范档的建设可从共建共享、构建新模型与规则、提升质量方面着手,发挥中文名称规范档在网络环境下的规范控制作用。  相似文献   

14.
付媛  朱礼军  韩红旗 《情报工程》2016,2(1):053-058
为应对日益严重的姓名歧义现象给提高搜索引擎查全率和查准率带来的挑战,同时给姓名消歧方法研究提供参考建议,对研究现状和主要成果进行总结.首先,介绍研究姓名消歧的目的和意义.其次,对国内外现有姓名消歧方法研究进展进行梳理,主要方法包括基于特征的、基于机器学习的、基于社会网络的、基于网络知识资源的姓名消歧等多种方法来解决姓名歧义问题.最后,文章分析各种方法的特征和不足,总结姓名消歧待解决的问题以及未来的研究方向.  相似文献   

15.
通过对CALIS西文联合数据库中个人名称标目的整理,分析了CALIS西文联合目录数据库中个人名称标目存在的质量问题,并提出了正确著录的方法和改进个人名称标目质量的措施。  相似文献   

16.
在深入分析NSTL篇级元数据特点的基础上,结合模糊匹配算法,提出一种适合NSTL现有数据的人名消歧规则集,并给出基于该规则集的人名消歧算法。通过对实际数据集的实验,该算法在准确率、召回率等指标方面都有良好的表现,具备较好的消歧效果。  相似文献   

17.
本体驱动的跨语言信息检索研究   总被引:5,自引:0,他引:5  
分析跨语言信息检索技术的翻译歧异性问题,指出多语本体的引入可以提高语义排歧的准确性,详细分析两个国外的跨语言信息检索系统,并在此基础上提出一个基于双语本体的中英跨语言信息检索模型及实现方案。  相似文献   

18.
以笔者长期检索经验为基础,以抽样检索结果为依据,将CALIS与国图OPAC书目检索结果进行对比分析。检索结果表明,二者书目数据质量高,值得肯定;存在的差异,各有特色。二者的共同问题是数据不规范、不一致。建议实行统一的编目规则,并严格执行,遵循以用户为中心的原则,以便于书目信息资源共享。  相似文献   

19.
孙德谦《汉书艺文志举例》是我国目录学研究史上第一部关于《汉书·艺文志》体例研究的专著,其将《汉书·艺文志》的体例归纳为46例,可谓详尽至极。但细究起来,孙氏所归纳之例并非完美无瑕,仍然存在着诸多问题,本文在前人研究的基础上对孙氏所举之例进行归纳与改造,提炼史志目录的体例,以期对目录学研究及书目编纂工作有所裨益。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号