首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
如何从语言学而非翻译学的角度去分析英汉对应语的语义不对等现象,学界研究不多。本研究以对比语言学研究的核心,即语言的共性和个性关系作为理论前提,通过比较英汉对应语之间的关系,构建英汉对应语"对称"模式,引入英汉对应语"不对称"概念。然后,用语义参数"X"表示英汉对应语的语义共核,以英汉动植物对应词语为例,对对应语不对称现象进行词汇语义学阐释和分类。  相似文献   

2.
本文将潜在语义索引理论与支持向量机方法相结合,对文本向量各维与文本的语义联系进行特征抽取,建立了完整的基于潜在语义索引的支持向量机文本分类模型,分析了该方法与分词的维数以及SVM惩罚因子选择之间的关系.并在NN-SVM分类算法的基础上,通过计算样本点与其最近邻点类别的异同以及该点与其k个同类近邻点在核空间的平均距离来修剪混淆点,提出了一种改进的NN-SVM算法:KCNN-SVM算法.利用该算法对降维后的训练集进行修剪.实验表明,用新的模型进行文本分类,与单纯支持向量机相比,受到文本分词维数以及支持向量机惩罚因子的影响更小,其分类正确率更高.  相似文献   

3.
将基于特征向量的平面核和基于句法分析树的结构核组合,进行中文实体关系抽取.首先进行特征选择实验,为构造平面核中的特征向量选择最优特征集合,特征包括实体大类、实体子类、实体类别等实体信息以及实体对在句子中的前后词信息.在定义结构核函数时,从包含两个实体的句子中提取最短路径包含树(shortest path tree,SPT),然后使用卷积树核函数来计算两棵SPT树的相似度.在ACE RDC 2005中文语料库上进行实体关系大类的抽取实验,其F值达到了68.50%,比两个单独核函数的方法分别提高4.36%和17.37%.同时,在组合核中也进行了特征选择实验,得到了最好关系抽取性能的F值为70.58%,说明单独平面核的最优特征集在组合核中未必最优.结果表明,本文利用实体语义信息构造平面核并与结构核组合,对于中文实体关系抽取具有较好的性能.  相似文献   

4.
基于本体的语义检索技术研究与实现   总被引:3,自引:0,他引:3  
在本体基础上通过语义相似度和相关度的计算,利用语义推理将描述的隐含语义显式化,以充分挖掘出与检索内容相关的信息,实现相关信息的语义融合,提高查准率和查全率。研究基于本体的语义相似度和相关度的计算方法,并通过该语义检索方法的实现,证明该方法在语义检索系统开发中的可行性。  相似文献   

5.
从图像语义层次描述方式、图像语义抽取方法两个方面对利用语义进行图像检索的研究状况进行总结,提出建立语义模板用于支撑高层语义检索,同时应用多层次的相关反馈方法建立和修正图像低层特征与高层语义间的联系,缩小图像检索过程中的“语义鸿沟”,达到一定程度语义检索的目的。  相似文献   

6.
基于本体的语义相关度计算方法以概念在本体中的结构特征,如深度、密度,概念间的语义关系类型、路径等一系列因素为基础来度量概念间的语义相关度,缺乏对传递因素的考虑.本文通过基于本体的通用语义相关度计算方法的影响要素分析、传统方法的特点研究及语义传递规律的介绍,提出一种基于传递的语义相关度计算方法,并利用<知网>与传统方法基于人工判断进行效果比较,验证了新语义相关度计算方法的应用效果.  相似文献   

7.
Folksonomy是一种自底向上、用户可以自由参与的分类方法,但随着标签数量的不断增加,Folksonomy的进一步发展受到制约,语义Folksonomy应运而生。语义Folksonomy是将标签的隐性语义信息显性化地表达出来,实现了标签之间的语义关联。目前,Folksonomy语义的实现主要从标签本体构建、词表语义关联、网络概念体系映射三方面展开,并且这三种方法相互结合可以构建出语义Folksonomy的实现框架。  相似文献   

8.
基于计量分析的馆藏资源语义化理论研究   总被引:1,自引:1,他引:0  
目前的馆藏资源语义化方法存在一定的问题。本文引入信息计量学分析方法,结合语义网的相关理论和方法,构建了基于计量分析的馆藏资源语义化理论模型。通过对信息计量学和语义网进行理论和可视化应用的类比研究,发现:①信息计量学从定义、主要规律、馆藏资源元数据的关系研究到元数据的可视化展示都与语义网的理论、应用非常类似;②基于计量分析的馆藏资源语义化方法在语义关系深度、计算机自动处理程度、可重复性和实用性方面比基于元数据和领域本体的馆藏资源语义化方法更好;③把计量分析方法应用到馆藏资源语义化中,不仅可以提高馆藏资源的应用效率,解决基于元数据和领域本体语义化的不足,还能促进交叉研究和学科发展。图5。表3。参考文献10。  相似文献   

9.
UMLS语义命题是用三元组表示的最小语义化知识单位,其主语和宾语都是UMLS超级叙词表中的概念,谓词是UMLS语义网络中的语义关系。UMLS语义命题的抽取过程涉及浅层句法分析、概念映射、谓词识别与语义命题生成等环节。两种以UMLS语义命题为基础的医学信息资源聚合方法——用知识单元作为资源单位的聚合方法和用文档关联数据作为资源单位的聚合方法,其聚合结果分别是知识网络和文档网络。  相似文献   

10.
语义网的实现需要为网络上现有的和新的文档进行广泛可用的语义标注,使其内容可被机器所识别和理解。语义标注是清晰、明确、容易理解的,可作为大量应用的服务基础,适用于多种文本,包括网页、普通(非网络)文档、数据库中的文本等。本文根据语义标注的研究历程,介绍了国内外面向文本的语义标注研究现状,对语义标注所使用的技术进行总结;在已有语义标注方法分类的基础上,对现有的标注方法进行分类分析;指出了近年来语义标注方法的不足,并探讨了面向文本文档的语义标注发展趋势。  相似文献   

11.
[目的/意义]旨在深入语义层面对研究主题进行分析。[方法/过程]提出基于本体的研究主题语义分析方法,从语义类型和与语义关联两个维度展开,并在实证研究过程中,以“医学信息学”为例,对方法进行验证。[结果/结论]结果表明,语义类型分析能够辅助研究者对研究主题的内容进行进一步的语义理解;语义关联分析从语义角度分析各个研究主题在语义含义上的关联,在辅助研究者分析某领域研究主题时,能够综合分析相关主题,并发现新的研究交叉点。  相似文献   

12.
在对概念语义相似度方法调研的基础上,本文提出基于概念向量的文本语义相似度测度方法,借助MetaMap工具抽取文本中的概念术语,将概念术语通过词表层级结构转化为概念向量,通过计算两文本中概念向量的语义相似度来测度两文本的语义相似度。为验证基于概念向量文本语义相似度方法的准确性,选取TREC-05 genomics track数据进行实验,实验结果表明,本文提出的方法较常用的余弦方法更优,与专家评估方法更接近,在测度文本语义相似度上具有一定的可行性和有效性。  相似文献   

13.
基于语义的图像检索系统的构建包括以下工作:设计高层语义的描述方式;图像语义 提取,即如何从视觉特征映射到高层语义;语义检索系统的实现。基于MPEC-7图像语义的 XML描述和系统检索的实现方法,构建了基于语义的图像检索系统的框架。图4。参考文献8。  相似文献   

14.
本体中同种语义关系间的可传递规律研究   总被引:2,自引:2,他引:0  
语义传递是研究知识组织、语义相关度以及知识挖掘与推理等信息科学领域的关键因素,但是由于缺乏语义传递判断的计算机模拟限制了其在信息科学领域的应用.语义关系间的可传递性是语义传递判断的关键因素,其规律性特质反映出了语义传递的相对稳定性,这种稳定性使得语义传递判断的计算机模拟成为可能.本文主要围绕同种语义关系间的可传递性规律获取方法,基本获取方法的经典型语义关系的传递规律,规律检测以及传递规律应用四个方面展开了研究,目的在于为语义传递判断的计算机模拟以及语义传递在信息领域中的应用提供基础.  相似文献   

15.
异种语义关系间的可传递性规律研究   总被引:1,自引:1,他引:0  
语义传递是信息科学领域多种研究的关键因素,但是由于缺乏语义传递判断的计算机模拟限制其在信息科学领域的应用.语义关系间的可传递性是语义传递判断的关键因素,其相对稳定的特质使得语义传递的计算机模拟成为可能,本文以异种关系间的可传递规律为研究对象,从传递规律获取方法,方法评述以及方法的具体应用展示3个方面进行了分析,目的在于为语义传递判断的计算机模拟以及语义传递在信息领域中的应用提供基础.  相似文献   

16.
对语义出版的相关研究进行梳理分析,指出语义出版对科研交流系统的影响,可以提高科研数据处理效率、满足科研数据利用需求、促进文献评价多维化。从建立框架模型、揭示语义关系等层面,分析了科研数字化潮流下语义出版的实现方法,并在分析语义出版技术路线基础上,研究语义出版的发展阶段,展望语义出版的发展前景。  相似文献   

17.
李向阳  张亚非 《情报学报》2005,24(1):100-106
简单分析了语法上界定汉语短语的困扰,提出一种利用语义搭配关系界定汉语短语的方法。首先,借助同义词词林实现语义知识的编码,用这种语义编码来表示语义搭配关系;其次,在此基础上,定义短语与已知语义搭配关系的相似性,计算词语搭配的合理性;最后,利用短语内部的语义搭配合理性优于其他搭配这一性质,用算法实现了基于语义的汉语短语界定过程。该方法应用于军事文本,从中界定出描述作战单位等信息的短语,取得较好的效果。此外,经该方法界定出的短语具有较强的语义信息,对信息抽取等实际应用具有一定的适用性。  相似文献   

18.
[目的/意义]针对医学文本的特点,提出一种基于语义图的多文档自动摘要方法,并利用其中的语义信息实现摘要主题的识别。[方法/过程]利用SemRep实现源文档概念及其语义关系的规范化抽取并构建语义图,从概念-关系-社区3个层次对网络图中的关键信息进行抽取并生成摘要,利用概念-语义类型-类型分组三级映射实现对概念的归类,结合语义搭配模式对摘要主题进行划分。[结果/结论]通过对5种疾病数据集进行测试,结果显示该方法能有效识别出文献集中的核心内容,语义图中所富含的语义信息能准确地对摘要进行主题划分。  相似文献   

19.
为了丰富专利分类的网络和文本语义表示,实现两者更有效的语义融合,提高技术融合预测效果,提出基于专利分类序列和文本语义表示的技术融合预测方法。首先,综合考虑专利分类位置及其上下文语境,直接对专利分类序列进行语义表示,提出基于专利分类序列语义表示的技术融合预测方法;其次,根据专利分类在序列中的重要性排序研究专利分类文本分配方法,形成基于专利分类文本语义表示的技术融合预测方法;在此基础上,设计多种特征融合方法,提出融合专利分类序列结构和文本内容语义表示的技术融合预测方法;最后,基于链路预测的理论和方法对提出的多种技术融合预测方法进行定量评价。在无人机领域的实验证实,专利分类序列语义表示模型的效果明显优于其他网络表示学习方法;依据重要性排序的专利分类文本赋予方式优于文本平均分配方式,基于此的专利分类文本语义表示能更好地进行技术融合预测;“SVM (support vector machine)+哈达玛积”的特征融合方法在所有方法中表现最优,较单一方法均有提高。本文提出的方法能够提高技术融合预测的效果,更好地为技术布局、技术研发提供借鉴和参考。  相似文献   

20.
自然语言语义分析研究进展   总被引:5,自引:0,他引:5  
按照自然语言的构成层次——词语、句子和篇章,分析各层次语义分析的内涵、现有的研究策略、理论依据及存在的主要方法,并对现存的两类主要研究策略进行对比分析.认为词语语义分析是指确定词语意义,衡量两个词之间的语义相似度或相关度;句子语义分析研究包含句义分析和句义相似度分析两方面;文本语义分析就是识别文本的意义、主题、类别等语义信息的过程.当前的自然语言语义分析主要存在两种主要的研究策略:基于知识或语义学规则的语义分析和基于统计学的语义分析.基于统计与规则相融合的语义分析方法是未来自然语言语义分析的主流方法,本体语义学是自然语言语义分析的重要基础.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号