排序方式: 共有115条查询结果,搜索用时 15 毫秒
41.
探讨了词元库对汉语框架网络知识库应用的影响,提出了利用同义词词林,采用基于语用的向量空间相似度计算实现词元扩充的方法,并对词元扩充的实现思路作了深入分析. 相似文献
42.
本文尝试解决中文学者命名实体与外部知识库的实体对齐短缺的问题。通过SPARQL语义查询抽取维基数据子图——中国科学院院士的知识图谱子图,初步构建国内知识库的中文院士实体与Wikidata实体的对齐以及与外部ID对应的知识库的实体对齐。对院士实体的三个数量型特征对齐的外部ID个数(ids)、不同语种的Wikipedia站点个数(sites)、实体的全部陈述个数(states)与目标分类(有无VIAF实体对齐)的相关分析发现,目标分类与ids特征正向相关最强,直接VIAF实体对齐只存在ids高区的院士,占比偏低。因此,提出利用 LC、ISNI等外部ID,应用VIAF对重要来源库的重定向功能,构建间接的VIAF实体对齐的方法。本文为中文知识库进行外部实体对齐提供了可行的初步方案,提出的实验方法显著地提高了较小ids值(1-7)的院士拥有VIAF实体对齐的个数,最终通过实体对齐的VIAF信息集成增加了院士实体的ids数量,丰富了中文学者与外部知识库的实体对齐信息。图4。表5。参考文献19。 相似文献
44.
2004年Thomas在与smith讨论中,针对Furl、Flickr和Del.icio.US这些网站,提出“Folksonomy”一词,认为其是“folk”和“taxonomy”的结合,用户能够对他所发布或使用的资源以标签的形式进行分类标注,以实现对社区内所标注的资源共享及其存取。这种用户自由定义的非正式的社会分类行为不同于原有的受控词表,其采用自下而上的构建方式,灵活随意性大,用户不需要任何学习就可完成分类任务,定义标签简单、直接、迅速。其所建立的标签一用户一资源三者之间的联系,既揭示了用户词汇选择的行为特征,又反映了用户对资源的偏好度,这些不断丰富的信息为进一步开展用户行为研究提供了客观准确的参考数据。 相似文献
45.
分众分类系统中的标签通过一系列聚类算法可以形成“标签树”,但标签树中的标签间语义关系未能显性化,不能称之为标签本体。另一方面受控词表类目体系或主题词更新缓慢,跟不上网络资源新名词、新主题增长的速度,导致许多资源无法用传统分类法标引。借鉴受控词表现有的语义关系来挖掘标签树的语义关系,形成一个轻型标签本体;另一方面通过标签本体与受控词表的共享词汇,制定筛选规则,将标签本体中符合受控词表选词规则的标签纳入受控词表,使分众分类系统成为受控词表更新源泉之一,使其重新焕发活力。 相似文献
46.
47.
框架元素语义类型的确定对于增加本体的语义信息及其建立本体之间的映射具有重要作用.探讨了利用WordNet中词汇的丰富语义等级结构,自动确定框架元素语义类型的方法,提出了同义词扩展、上位词扩展的确定思路,并引入Wu-Palmer语义相似度算法,同时考虑WordNet及FrameNet不同的语义深度,以帮助有效地选择框架元素语义类型. 相似文献
48.
图书馆、档案馆、博物馆馆藏资源整合是文化资源得以广泛传播利用与共享的基础,与同类型机构资源整合相比,LAM资源整合中馆藏资源类型不一,资源描述所使用的元数据标准繁多,描述细粒度大小不同,整合难度增加。本文在梳理LAM馆藏资源整合流程的基础上,认为LAM馆藏资源的整合实质是不同类型机构之间元数据的整合。结合不同的LAM项目,将馆藏资源的元数据整合方法划分为以元数据、本体、关联数据模型为映射中心的三种类型,结合语义网络发展技术对每一种整合方法进行优劣势分析,并围绕EAD标准,展示其与本体、关联数据模型进行映射的具体实现方式。 相似文献
49.
开放型网络百科是一种集体创造知识的协作平台,其中中文百科领域的代表是中文维基百科和百度百科.文章立足于中文维基百科,运用对比分析方法,从类目体系、类名及条目等角度对中文维基百科和百度百科分类系统作出了探索性的研究.明确两个类目组织系统的差异及共同点,以帮助用户针对性地选择适合的百科系统. 相似文献
50.
[目的/意义] 对Wikidata数据特点、获取方式及其应用进行剖析,旨在带动国内开放数据集的增加,提高国内数据集与国外数据集的关联度。[方法/过程] 采用综合归纳及比较研究的方法,阐述Wikidata 的发展历程,对其数据特点及数据模型进行研究,梳理目前可获取Wikidata数据的5种方式。[结果/结论] Wikidata具有开放、协作、多语言、结构化的特点,其以条目为核心,定义了实体类及属性,提供了多样化数据获取方式,且当前基于Wikidata的应用主要集中在语义检索、多语种查询、知识可视化、知识库构建与虚拟研究环境搭建5个方面。 相似文献