共查询到20条相似文献,搜索用时 515 毫秒
1.
中文叙词表本体一致性检测机制研究与实现 总被引:3,自引:0,他引:3
本文研究了中文叙词表本体(OntoThesaurus,即基于中文叙词表建立的本体知识库)的一致性检测机制,并将其应用在中文叙词表本体共建共享系统(OTCSS)的修订意见提交、叙词表本体更新和全局检查等相关过程的实现中,取得了良好的应用效果。 相似文献
2.
中文叙词表本体的检索实现及其术语学服务研究 总被引:4,自引:0,他引:4
在简单介绍中文叙词表本体共建共享系统OTCSS项目背景的基础上,阐述实现中文叙词表本体网络术语学服务(OntoThesaurus-TS)的意义。详细描述OntoThesaurus的检索实现方法,以及其术语学服务应用场景典型案例,并对OntoThesaurus的术语学服务提出进一步研究计划。 相似文献
3.
中文叙词表本体共建共享系统研究 总被引:6,自引:0,他引:6
本文阐述了中文叙词表本体(OntoThesaurus,即基于中文叙词表建立的本体知识库)共建共享系统的设计思想和总体结构.描述了中文叙词表转换为OWL本体的扩展TBox定义,叙词表文本的ABox实例自动转换,OntoThesaurus的一致性检测机制;OntoThesaurus在图书情报界及语义Web界的广泛共享应用前景;在共享应用中采集标引员、领域专家和一般检索者知识实现本体共建和动态完善的完整过程.最后对我国叙词表编纂机构快速实现现有中文叙词表(主题词表)的网络化共建和共享服务提出了建议. 相似文献
4.
针对中文叙词表等高受控词表的描述需求以及向细粒度本体的演化趋势,在已有中文叙词表本体研究成果的基础上,基于OWL DL和OWL2研究制定高受控词表的OntoThesaurus描述规范,确定独立的命名域及其缩写以及一整套严格的形式化定义。根据语义Web的应用环境,编写OntoThesaurus的RDF Schema,以RDF/XML语法的方式向机器用户提供其中的类和属性的使用。说明OntoThesaurus不同于SKOS和CNKOS的特殊定义,给出描述示例以及三者之间的词汇对应关系。最后简单介绍OntoThesaurus支持系统的功能。 相似文献
5.
中文叙词表本体的形式化表示与SKOS的比较研究——以及对建立中文知识组织系统形式化表示标准体系的建议 总被引:1,自引:1,他引:0
为方便我国中文知识组织系统(KOS)编纂机构选择合适的形式化表示语言,尽快实现传统中文KOS的形式化表示和网络化应用,文章从目标层次和具体的类与属性层次对SKOS(简单知识组织系统)和OntoTesaurus(中文叙词表本体)进行比较.研究表明:基于RDF的SKOS适于为形式化要求较低的中文KOS的网络开发提供表示语言和API工具;而基于OWL DL的OntoThesaurus则为中文叙词表等高受控的中文KOS的网络开发及其向本体的发展提供了可行的形式化表示方案和共建共享配套系统.最后提出建立中文KOS形式化表示标准体系的建议. 相似文献
6.
基于SKOS的叙词表到本体的转换研究 总被引:2,自引:0,他引:2
针对从叙词表到本体的转换中存在的没有统一转换标准的问题,引入W3C推荐的知识组织体系SKOS作为叙词表转换的标准;分析知识组织体系SKOS的特点;实际应用SKOS Core词汇表完成UKAT叙词表节选段落到本体的转换;并应用骨架法对该本体进行评价,指出该本体的特点及局限。 相似文献
7.
8.
论文分析了叙词表在我国电子政务信息资源组织中的应用,比较了电子政务中的叙词表和本体的区别与联系,并探讨由电子政务叙词表向电子政务本体转换的可能性和具体方法.最后以<综合电子政务主题词表>为基础,运用Protege软件构建电子政务本体样本. 相似文献
9.
对比我国、美国以及国际上几种叙词表编制标准,分析了其中叙词表等级关系处理和显示的异同,并展望了叙词表词间关系处理与显示在网络时代的进展和前景。表3。参考文献9。 相似文献
10.
11.
12.
13.
14.
以VMware Workstation为虚拟硬件开发平台,Tornado为交叉编译环境,通过网络下载的方式向虚拟机成功移植了VxWorks操作系统。介绍了虚拟机平台的构造和虚拟网卡驱动程序的移植过程,给出了内核映像的定制流程,详细探讨了bootrom的编译和引导盘的制作方法。最后,分析了VxWorks串口驱动的基本框架,并通过编译下载应用程序,实现了虚拟机平台和普通PC机之间的串口通信。 相似文献
15.
基于机器学习的文本自动分类研究进展 总被引:6,自引:0,他引:6
文本自动分类是目前最常用的文本信息自动处理技术,也是机器学习、自然语言处理和信息检索领域的研究热点之一。本文比较全面、深入地论述了基于机器学习的文本自动分类所涉及的相关问题及解决方法,并提出了当前该领域面临的主要研究问题。 相似文献
16.
[目的 /意义]将海量学术文本观点提取工作由人工转向机器,提高效率的同时又能够保证观点提取的准确性、客观性。[方法 /过程]使用UniLM统一语言预训练模型,训练过程中对模型进行精调,以人工标注数据集进行机器学习。将学术文摘作为长度为a的文本序列,经过机器学习,生成长度为b的句子序列(a≥b),并且作为学术论文观点句输出。[结果 /结论 ]研究结果表明:UniLM模型对于规范型文摘、半规范型文摘、非规范型文摘观点生成精准度分别为94.36%、77.27%、57.43%,规范型文摘生成效果最好。将机器学习模型应用于长文本观点生成,为学术论文观点生成提供一种新方法。不足之处在于本文模型依赖文摘的结构性,对非规范型文摘观点生成效果有所欠缺。 相似文献
17.
近两年来,神经机器翻译(Neural Machine Translation, NMT)模型主导了机器翻译的研究,但是统计机器翻译(Statistical Machine Translation, SMT)在很多应用场合(尤其是专业领域)仍有较强的竞争力。如何利用深度学习技术提升现有统计机器翻译的水平成为研究者们关注的主要问题。由于语言模型是统计机器翻译中最核心的模块之一,本文主要从语言模型的角度入手,探索神经网络语言模型在统计机器翻译中的应用。本文分别探讨了基于词和基于短语的神经网络语言模型,在汉语到英语和汉语到日语的翻译实验表明神经网络语言模型能够显著改善统计机器翻译的译文质量。 相似文献
18.
面向专利领域的机器翻译近年来已成为机器翻译的重要应用领域之一。本文提出了一个汉英专利文本机器翻译融合系统,该系统以规则系统为主导搭建,并把规则翻译方法和基于短语的统计翻译系统相结合。在融合系统中,规则系统主要负责源语言的分析和转换阶段的处理,生成相应的源语言句法分析树与转换树,并确定目标语言的基本句法框架。统计翻译系统则在目标语生成阶段根据生成的目标语句法结构寻找合适的对译词形,并产生最终的候选译文。通过利用自动评测指标对融合系统进行测试,融合系统的结果均优于单个规则系统和统计系统的结果,表明了融合方法的有效性和可行性,可以改善系统的翻译性能,提高翻译质量。 相似文献
19.
本文创新性构建学术论文被引影响因素特征空间,以我校SCI&SSCI学术论文为例,验证机器学习模型在预测学术论文被引频次研究中的有效性和准确性,本文的分析结论可以为高校图书馆开展决策支持服务提供参考。本文梳理学术论文被引频次影响因素及预测方法的相关研究,结合传统文献计量和Altmetrics指标构建学术论文影响因素的特征空间,并通过实验比较线性回归、神经网络、支持向量机三种机器学习模型在预测学术论文被引频次研究中的有效性和准确性。本文的分析结论证明基于Altmetrics视角构建的特征空间的预测准确率大幅度提高,并且支持向量机模型在对学术论文影响力预测的实证研究中表现出优异的性能。 相似文献
20.
本文对传统的机读目录格式进行深入的研究,设计了从传统的机读目录格式向适合现代数字图书馆的结构化著录格式-XML的转换步骤,给出了从数据库到XML的过程。 相似文献