首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
虚拟国际规范文档(VIAF)项目进展   总被引:1,自引:0,他引:1  
崔春  毕强 《图书情报工作》2014,58(6):129-134
对虚拟国际规范文档项目(VIAF)的进展进行梳理总结,介绍其起源、目标、发展历程、数据生成过程、面向终端用户的界面功能;梳理其在重要的网络服务项目如国际标准名称标识符(ISNI)、维基百科、社会网络与档案文本项目(SNAC)中的应用现状,并认为我国应从以下几方面加强我国的名称规范工作:尽快加入VIAF以在全球范围内共享中文规范数据资源、整合少数民族规范数据并构建国家虚拟规范文档、整合书目数据以外的名称资源。  相似文献   

2.
基于词典和统计的语料库词汇级对齐算法   总被引:5,自引:0,他引:5  
语料库词汇一级的对齐,对于充分发挥语料库的作用意义重大。本文对汉英句子一级对齐的语料库,提出了借助于词典和语料库统计信息的有效的对齐算法。首先利用词典的词的译文及其同义词在目标语中寻找对齐;其次利用汉语词汇与英语单词的共现统计信息以最大的互信息寻找对齐词汇以及相邻短语。实践证明该方法是行之有效的  相似文献   

3.
价值观对齐关系着AI大模型是否能真正为人类服务,甚至关乎着意识形态安全乃至国家政治安全。从意义、准则、路径、困境四个维度对AI大模型价值观对齐进行全面剖析,认为安全问题与应用保障是AI大模型价值观对齐的驱动力量,原生价值观、目标价值观、普适价值观是AI大模型价值观对齐的价值选择,尤其强调国内AI大模型应以社会主义核心价值观为对齐目标。价值观对齐的主要实践路径包括非递归监督与可扩展监督两条,并对国内外常见的四种价值观对齐范式进行简要介绍,总结出对齐税、价值观以及对齐效果评估方面的对齐困境。  相似文献   

4.
用于中文信息自动分类的《中图法》知识库的构建   总被引:1,自引:0,他引:1  
分类号、主题词、关键词是三种主题概念标识,三者之间存在着概念对应关系,即兼容关系。中文文献数据库中存在着大量的分类号与关键词(或主题词)对应的人工标引记录。通过对这些数据的加工整理,以《中图法》类目体系为主干组织各学科领域的语词,从而构建出反映分类号与语词概念对应关系的《中图法》知识库,用以实现信息的自动标引和自动分类。本文详细讨论了该知识库的构建原理、结构、编制使用的关键技术以及主要应用等。  相似文献   

5.
[目的/意义] 在进行大规模知识库构建时,基于手工方式的构建模式效率较低并且可行性较差,因此,从网络百科中自动地获取海量知识已经被越来越多的学者所关注。目前的研究主要关注于从英文网络百科数据源进行海量知识的抽取,而面向中文百科数据源进行的知识抽取研究工作尚处于起步阶段。[方法/过程] 为解决中文大规模知识库的构建问题,提出一种新的基于中文网络百科架构的大规模知识库的自动化构建方法:在第一阶段,对知识三元组中的主语和宾语之间的语义关系进行自扩展学习;在第二阶段,基于条件随机场和支持向量机协同分类器,对标注出的属性和属性值实体之间的语义关系进行预测。[结果/结论] 实验评测结果表明,该方法较前人工作在典型中文百科分类页面中的实体识别查准率和查全率分别最高有约10%和6%的提升。  相似文献   

6.
《中文新闻信息分类》标准经过历时一年8个月的研制及反复检测论证,在2005年9月2日专家评审会上,标准审查委员会一致通过对《中文新闻信息分类》国家标准(送审稿)的审查,建议标准起草组尽快形成报批稿,上报国家标准化管理委员会作为推荐性国家标准发布实施。作为我国第一部即将上报的新闻信息分类标准,《中文新闻信息分类》标准的研制工作取得了初步的成果,但能否在业界真正实现应用,达到整合全球中文新闻信息的目的,最为关键的是下一步技术支撑的构建。因此,只有建立自动标引系统,实现自动分类,《中文新闻信息分类》标准的现实价值才能真正体现。本文提出了实现自动标引的整体构想,希望为《中文新闻信息分类》标准下一步的研究与实际应用有所贡献。  相似文献   

7.
用于中文信息自动分类的《中图法》知识库的构建   总被引:4,自引:0,他引:4  
中文文献数据库中存在着大量的分类号与关键词(或主题词)对应的人工标引记录。通过对这些数据的加工整理,以《中图法》类目体系为主干,组织各学科领域的语词,从而构建出反映分类号与语词概念对应关系的《中图法》知识库,用以实现信息的自动标引和自动分类。构建《中图法》知识库面临着一些难题:异构数据的整合;原始数据中分类号与主题词或词串之间一对多、多对多关系的筛选;标引词串与知识库中的词串的相符性比较等。图2。参考文献8。  相似文献   

8.
针对中文短文本自身词汇个数少、描述信息弱的缺陷,引入特征扩展的方法辅助分类。借助网络知识库维基百科抽取相关概念,并采用统计规律与类别信息相结合的方式计算概念间相关度,建立语义相关概念集合,对短文本的特征向量进行扩展,从而有效补充短文本的语义特征。对比实验表明,基于维基百科的短文本分类方法能够提高短文本分类的效果。  相似文献   

9.
《中国传媒科技》2005,(9):49-49
由中国标准化研究院组织实施的《中文新闻信息分类》国家标准(送审稿)审查会,于2005年9月2日上午在北京召开。来自国家标准化管理委员会、国家新闻出版总署、中宣部出版局、国务院新闻办网络局、中国标准化研究院、新华通讯社、中央人民广播电台、法制日报社、国家图书信、北京大学信息管理系、北京大学图书馆、武汉大学信息管理学院、北京市信息资源管理中心、中国电影资料馆等单位的15位专家组成了标准审查委员会,负责对“中文新闻信息分类”国家标准(送审稿)进行讨论与审定。  相似文献   

10.
基于知识库的网页自动标引和自动分类系统的设计   总被引:15,自引:0,他引:15  
针对中文网页文本信息特征,提出了信息标引和组织方案,并构建了一个基于知识库的网页自动标引和自动分类系统。中文网页的自动标引和自动分类思想主要基于知识库进行。知识库实际上是一个基于《中图法》的专家知识系统,包括了中图法库、汉表库、分类号主题词对应库、同义词库、关键词库等若干数据库。在确定网页基本信息标引源的基础上,中文网页主题标引运用了基于词频的统计加权法;通过与分类号一主题词对应库主题词串的词面相似度计算,进一步完成中文网页的分类标引。最后还讨论了新词识别等技术问题。  相似文献   

11.
[目的/意义]探讨学者关联数据集的定位及其构建方法,以期为学科发展、学者评价与信息共享利用提供便利。[方法/过程]在阐释现有机构知识库内涵基础上,分析学者关联数据集之功能特点,并以我国图书情报领域为例,通过开源软件D2R发布该领域学者的关联数据集。[结果/结论]学者关联数据集不同于机构知识库,它以所属学科领域的学者为数据起点,以网罗一切相关信息资源,并以完全开放、关联与共享的方式提供知识。在学者关联数据集的构建与发布过程中,重点需克服实体URI定义、作者重名、专著与网络学术记录难以采全等问题。  相似文献   

12.
从网络信息环境和如何构建中文网络信息分类体系两大方面,对近几年图书情报界的中文网络信息分类研究作了简单的综述。  相似文献   

13.
基于语料和基于标引经验的自动分类模式比较   总被引:1,自引:0,他引:1  
以传统文献分类体系为框架,构建知识库或分类器来实现信息的自动分类是信息加工自动化的一个发展方向。这种自动分类系统一般有两种模式:基于训练语料和基于人工标引经验。我实验室分别在这两种模式的基础上设计开发了两个不同的自动分类系统。本文将详细介绍这两个自动分类系统的结构、设计及其构建,然后分别从原理、知识库构建、分类算法等方面对这两者进行比较分析。  相似文献   

14.
中文信息自动分类用知识库的设计与构建   总被引:11,自引:2,他引:9  
侯汉清  薛鹏军 《情报学报》2003,22(6):681-686
在计算机智能处理技术远未成熟的情况下 ,基于概念语义网络的自动分类采用知识库技术 ,仍将是一种实用的选择。本项研究根据分类语言、主题语言、自然语言三者兼容互换的原理 ,以众多标引员的主题标引和分类标引的经验 ,即文献数据库实体中大量存在的文献分类号和主题词双重标引数据为基础 ,建立一个以《中图法》为基础的的分类知识库———分类法与主题词表对照数据库。论文对构建分类知识库的思路、步骤及主要技术 ,包括关联度测度方案、标引词模式匹配、新词增补等进行了讨论  相似文献   

15.
美国数字图书馆的发展目标   总被引:1,自引:0,他引:1  
据美国国会图书馆通讯报道,美国数字图书馆的第一期研究目标如下:(1)信息收集、分类和组织分页,编制语音、视频、图形理解索引,超媒体链接和知识表达。(2)信息检索、浏览、过滤、汇综,可视化理论与模式,智能处理,学习模拟,导航,隐喻等。(3)网络协议和标准,网络信息的利用与保密,知识库,压缩,模式化,知识产权的研究。美国数字图书馆的第二期研究目标是:(1)以人为中心的研究:研究数字图书馆技术,以进一步帮助人们在生产、查询和使用信息方面的活动。(2)基于内容和内容收集的研究:对新颖的数字化内容的理解与…  相似文献   

16.
考察了我国医药卫生、化学化工和电子信息三类学科核心期刊网站的被链接情况,重点分析了外部链接中域名为.com和.com.cn的站外链接类型和施链网站类型,得出结论:(1)要加快学术期刊电子化的发展,以扩大其在国际上的影响力;(2)期刊网站应该提供丰富的信息资源以发挥其学术交流的作用;(3)学术期刊网站应加强与本学科行业网站的联系,为本行业发挥其传递知识信息的作用;(4)广大学者应该增强利用网络进行学术交流的意识,为中文期刊网络化的发展做出贡献。  相似文献   

17.
机构知识库发展的动力机制与动力模型研究   总被引:9,自引:2,他引:7  
在分析不同学者对机构知识库内涵界定的基础上,提出机构知识库是对机构内成员智力产品进行收集、存储、管理并提供开放利用的知识传播与知识服务系统,探讨了机构知识库发展的六大动力因素,即长期保管与存取数字资产的需求、开放获取运动、科学信息与知识的共享及创新、数字化信息技术与标准、机构主体以及理论与实践进展,并分析了机构知识库发展动力因素互动机理,构建了机构知识库发展动力模型。  相似文献   

18.
与会者首先讨论了机构知识库的范畴、组成和具体内容。大家一致认为,美国国家信息标准协会(National Information Standards Organization,NISO)应该把机构知识库的概念进行广泛扩展,把机构知识库建设成为一个方便不同领域的学者们存取资源的平台。  相似文献   

19.
基于本体的专利摘要知识抽取*   总被引:4,自引:0,他引:4  
采用知识工程的方法,对“新能源汽车”中文专利摘要进行研究分析,提出了一个基于本体的中文专利摘要抽取模型。通过构建相应的本体、收集相关的词表、撰写相应的规则,并利用这些规则对专利摘要进行知识抽取结果,抽取结果辅助完成专利知识库的自动构建。即就如何组织非结构化信息以及如何自动构建知识库的进行尝试,验证了基于本体对专利摘要进行知识抽取的可行性。  相似文献   

20.
类是“许多相似或相同的事物的综合”。分类,就是依据一定特征(标准)将分类对象划分为若干类的过程。分类是人们认识客观事物的一种逻辑方法。科技档案分类包括两种含义:其一是科技档案的实体分类;其二是科技档案的信息分类。所谓科技档案实体分类是指以科技档案客体本身为对象,以揭示科技档案自然形成的内在有机联系,从而便于库藏科技档案的排架与管理为主要目标的分类。所谓科  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号