排序方式: 共有112条查询结果,搜索用时 0 毫秒
1.
[目的/意义]机构名称的数目多且较为繁杂,机构名称归一化可将同一机构的规范名称以及不同时段、不同表达形式的非规范名称汇集在一起,提高查询检索的查全率和查准率;有利于建立与其他系统之间的互操作,实现资源的共享。[方法/过程]在分析机构名称字符串的特点和基于K-means算法的基础上,利用编辑距离算法实现一级机构名称的初步聚类,然后利用初步聚类结果并基于TF-IDF算法计算机构名称各词项的权值,从而基于K-means算法将机构名称围绕聚类中心抱团聚簇,并对每一个簇的机构名称赋予唯一标识符。[结果/结论]该方法可实现同一机构实体不同形式的规范名称的归一,提高机构名称聚类的准确率,但对K取值、距离测度方法的选取仍有待优化。 相似文献
3.
4.
当前语义网发展环境下,许多机构纷纷将其有价值的数据公开,并建立数据间的链接,形成了有价值数据网络。图书馆作为信息资源丰富的机构,建立与Web资源的开放互联,可有效地提高信息的价值和信息服务水平。本文阐述了开放书目数据的优势主要体现在元数据的开放与共享、资源发现、用户行为识别与分面浏览,并提出了开放书目数据由数据集、词汇表、元数据集三方面构成,最后讨论了开放书目数据的实现流程。 相似文献
5.
[目的/意义]名称规范档在书目数据库中对书目记录的检索点进行规范化校验,通过实现标目的一致性,达到检索效率提升、目录汇集的目的。分析国外名称规范档的最新研究进展及实践,以期为中文名称规范档的发展研究提供借鉴。[方法/过程]通过对当前中文名称规范档建设存在的问题进行客观分析,结合国外名称规范档的研究进展及实践,提出中文名称规范档的建设发展方向。[结果/结论]当前中文名称规范档的建设存在着数据规模小、数据完全性差、数据共享性低问题,从国外名称规范档的发展看出,其不再局限于图书馆内部建设,开始向合作共建共享发展,规范数据不再面向OPAC系统,向开放互联发展。因此中文名称规范档的建设可从共建共享、构建新模型与规则、提升质量方面着手,发挥中文名称规范档在网络环境下的规范控制作用。 相似文献
6.
7.
[目的/意义]研究利用维基百科条目的丰富信息来补充完善当前中文名称规范档附加信息不足、名称难以准确区分的问题。[方法/过程]探讨网络环境下个人名称规范档的部分缺陷和维基百科相应的优势,重点阐述维基百科的接口Media Wiki API,并从两个方面探讨实现个人名称规范档与维基百科的链接应用:一是实现从名称规范档到维基百科的链接,二是动态生成个人简介,为名称规范档提供必要的信息来源。[结果/结论]集成维基百科的资源实现中文名称规范档信息的自我完善,有效地建立中文人名名称规范档与维基百科的链接,有助于个人名称的识别与检索。 相似文献
8.
关联数据是语义网的一个简单应用,用来在语义网中使用RDF和URI发布、分享、连接各类数据、信息和知识。图书馆界应用关联数据发布资源的过程中,最为关键的一步是如何将MARC格式转换成RDF格式。针对CNMARC的特点,借鉴国外图书馆MARC21转换成RDF的成功做法,构建CNMARC到RDF的映射实现,并探讨在转换过程中遇到的一些问题。图1。表8。参考文献17。 相似文献
9.
10.
分众分类标签的语义模糊性和标签无序性使得检索效率越来越低,为准确定位标签语义,旨在研究一种新的方法,从主题词表的词间关系判断标签间的语义关系。以《中国分类主题词表》教育类主题词搜索Delicious网站得到的相关标签作为数据源,分析标签与主题词的重叠度,选择《中国分类主题词表》和ERIC在线教育词表作为标签的语义关系抽取工具,认为相关标签集中语义关系较为丰富。 相似文献