首页 | 官方网站   微博 | 高级检索  
     

中文个人名称规范记录的实体匹配与聚簇
引用本文:王瑞云,贾君枝.中文个人名称规范记录的实体匹配与聚簇[J].国家图书馆学刊,2017,26(2).
作者姓名:王瑞云  贾君枝
作者单位:山西大学经济与管理学院
基金项目:本文系国家社科基金重点项目“基于关联数据的中文名称规范档语义描述及数据聚合研究”(项目编号:15ATQ004)的研究成果之一。
摘    要:本文尝试解决国内个人名称规范联合数据库检索结果集基于实体匹配的聚簇问题,分析国内名称规范联合库CCCNA的检索服务和数据库记录特点,提出对结果集记录合并聚簇的思路:首先预处理去除重复和明显的名称语义不匹配记录,再根据提取出的个人实体属性名称、出生年、个人关联的书目题名及关联的外部记录,基于个人实体的语义进行个人名称规范记录聚簇.实证统计结果显示,处理后结果集内的簇数都显著低于处理前的记录条数,与VIAF的关联聚簇结果也验证了本文方法的有效性.但本文书目匹配采取题名匹配,这会丢失一些有用的聚簇信息,后续研究将进一步集成图书机构的书目数据库,抽取更多的书目信息进行聚簇.

关 键 词:虚拟国际规范文档  个人名称规范档  实体匹配  聚簇

Entity-Based Matching and Clustering of Chinese Personal Name Authority Records
Wang Ruiyun,Jia Junzhi.Entity-Based Matching and Clustering of Chinese Personal Name Authority Records[J].Journal of the National Library of China,2017,26(2).
Authors:Wang Ruiyun  Jia Junzhi
Abstract:
Keywords:
本文献已被 万方数据 等数据库收录!
点击此处可从《国家图书馆学刊》浏览原始摘要信息
点击此处可从《国家图书馆学刊》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司    京ICP备09084417号-23

京公网安备 11010802026262号