期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	1篇
免费	1篇

专业分类

科学研究	1篇
信息传播	1篇

出版年

2019年	1篇
2018年	1篇

排序方式： 共有2条查询结果，搜索用时 46 毫秒

科研机构名称归一化实现

贾君枝曾建勋李捷佳付晓梅《图书情报工作》2018,62(13):103-110

[目的/意义]机构名称的数目多且较为繁杂,机构名称归一化可将同一机构的规范名称以及不同时段、不同表达形式的非规范名称汇集在一起,提高查询检索的查全率和查准率;有利于建立与其他系统之间的互操作,实现资源的共享。[方法/过程]在分析机构名称字符串的特点和基于K-means算法的基础上,利用编辑距离算法实现一级机构名称的初步聚类,然后利用初步聚类结果并基于TF-IDF算法计算机构名称各词项的权值,从而基于K-means算法将机构名称围绕聚类中心抱团聚簇,并对每一个簇的机构名称赋予唯一标识符。[结果/结论]该方法可实现同一机构实体不同形式的规范名称的归一,提高机构名称聚类的准确率,但对K取值、距离测度方法的选取仍有待优化。相似文献

基于关联数据的作者数据聚合研究

下载免费PDF全文

李捷佳贾君枝《情报科学》2019,37(1):16-21

【目的/意义】针对豆瓣读书书目信息中作者名称信息较少和不规范的现象，将其与中文名称规范联合数据库中个人名称数据进行聚合，丰富名称变异形式，实现异构、异地数据的相互关联。【方法/过程】首先介绍了受控词表与分众分类词表，分析了二者结合的必要性；然后构建数据集，并且基于LCS、Jaro-Winkler Diatance及编辑距离算法进行实验，确认豆瓣读书数据和中文名称规范联合数据库数据异构对齐的可行性；最后通过构造资源描述框架模式（RDFS）词表，对各实体属性进行规范化，将其发布为关联数据，实现本地站点的数据关联化。【结果/结论】基于关联数据实现了豆瓣读书作者名称数据与其对应的作品数据，以及中文名称规范库个人名称数据的聚合。相似文献