共查询到20条相似文献,搜索用时 484 毫秒
1.
2.
3.
4.
5.
【目的/意义】实现对领域本体分类关系的自动学习识别,解决领域本体知识框架结构体系的自动化构建问
题。【方法/过程】通过对领域本体分类关系自动识别的国内外研究现状及存在问题进行分析总结,以当前开源的先
进的深度学习文本预训练模型BERT为基础,研究构建了基于BERT的领域本体分类关系自动识别模型,并以资源
环境学科领域为例进行了实验研究和评估分析。【结果/结论】基于BERT构建的分类模型能够实现对领域本体分类
关系的自动识别,识别方法和流程具有极大地通用性和可移植性,识别精度比传统方法有了较大提升。【创新/局
限】微调与泛化了BERT,提高了领域本体分类关系识别模型的通用性和精度。但由于受分类标注语料的质量限
制,模型精度尚未达到峰值,有待进一步优化提升。 相似文献
6.
7.
针对传统的支持向量机在分类中不能够逼近任意的分类界面,而造成分类精度低的问题,本文在传统的支持向量机核函数基础上,提出了一种基于遗传算法优化的支持向量机结构模型,并将该方法应用在DNA序列分类上。实验结果表明了本文算法在同等条件下要比传统的SVM分类方法具有更加优越的特征提取性能。 相似文献
8.
基于决策树分类的云南省迪庆地区景观类型研究 总被引:3,自引:0,他引:3
决策树分类是基于空间数据挖掘和知识发现的监督分类方法。本研究利用遥感TM数据和DEM数据,构建分类决策树,并通过ENVI软件实现决策树分类,得到迪庆地区的景观类型分布图。同时利用传统的监督分类的方法进行分类,得到该地区景观类型分布图。利用野外实地采样的数据对两种分类方法进行精度评价,结果表明,两种分类方法的总体分类精度分别为85.5%和67.4%,决策树分类方法的总体分类精度比传统监督分类提高了近20%。在此基础上,研究云南省迪庆地区的景观类型分布状况,可得到以下结论:迪庆地区的景观类型主要有河谷灌丛面积约占5.5%,针叶林面积约占36.16%,亚高山灌丛草甸面积约占3.4%,高山冰雪面积约占3.7%,裸地面积约占25.4%,水体面积约占4.4%。除裸地和水体外,其他景观基本都沿着山体按海拔高度和坡向分布,其中面积最大的为针叶林景观。这与该地区高山峡谷地貌吻合。 相似文献
9.
常用的网页分类技术大多基于普通文本分类方法,没有充分考虑到网页分类的特殊性——网页本身的半结构化特征以及网页中存在大量干扰分类的噪音信息,同时多数网页分类的测试集和训练集来源于同一个样本集而忽视了测试集中可能包含无类别样本的可能。基于向量空间模型,将样本集看成由有类别样本和无类别样本两部分组成,同时选择了样本集来自于相同的网站,在去除网页噪音基础上结合文本相似度算法和最优截尾法,提出了一种基于不完整数据集的网页分类技术LUD(Learning by Unlabeled Data)来改善分类效果,提高分类精度。实验证明:LUD算法与传统的分类方法相比较而言,不但可以提高已有类别样本的分类精度,更主要的是提供了一种发现新类别样本的方法。 相似文献
10.
农作物遥感分类特征变量选择研究现状与展望 总被引:5,自引:0,他引:5
农作物遥感分类是农作物种植面积估算的重要核心问题,是提高农作物种植面积估算精度的关键研究内容。特征变量的选择是农作物遥感分类的重要步骤,有效地使用多种特征变量是提高农作物遥感分类精度的关键。随着多源数据获取的更加容易,电磁波谱特征、空间特征、时间特征以及辅助数据特征在农作物遥感分类中发挥着重要的作用。本文简要回顾和综合分析了在农作物遥感分类中所使用的各种特征变量,包括多光谱特征、微波散射特征、多源数据特征、高光谱数据特征等电磁波谱特征,以及空间特征、时间特征和辅助数据特征等,并分析了农作物遥感分类特征变量选择方面存在的问题和发展趋势。指出目前农作物遥感分类特征变量选择存在的关键问题主要包括特征变量选择的理论研究不足和综合应用存在缺陷两个方面。未来农作物遥感分类特征选择研究的核心内容主要包括生化组分特征及冠层结构特征等农作物遥感分类新特征变量的挖掘、分类特征变量的综合应用、农作物遥感分类特征变量的敏感性和不确定性研究3个方面。 相似文献
11.
12.
《黑龙江科技信息》2017,(19)
高光谱影像的分类中存在Hughes现象,随着维数的提高,所需要的样本数量也越来越多,因此训练样本数量的增加会使分类精度得到一定提高。本文利用AVIRIS高光谱影像数据,在标准训练样本集的基础上选取5%、10%和30%三种样本数量,分别在主成分分析、等距特征映射和拉普拉斯特征映射3种降维方法,及最大似然、人工神经元网络和支持向量机3种典型的分类方法的组合下进行了监督分类实验,分析了训练样本数量对高光谱影像总体分类精度的影响。结果表明:训练样本数量的增加在一定程度上能够提高高光谱影像的分类精度,但在不同的降维方法和分类方法上表现有一定差异,相对而言主成分分析法和支持向量机法的分类精度对样本量的增加更加敏感,且在相同的降维方法下支持向量机法的分类精度最高。 相似文献
13.
网页文本特征数常高达上万个,无用和冗余特征相当多,为提高网页文本分类精度,提出一种混合智能算法的网页文本分类方法。首先采用遗传算法对网页文本特征初步选择,然后采用蚁群算法对初步选择特征进行精细选择,最后采用K近邻算法建立文本分类器。结果表明,混合智能算法很好消除无用和冗余特征,提高了网页文本分类的精度,加快分类速度。 相似文献
14.
15.
高强度人为扰动所带来的地表破碎化使得"同物异谱"和"异物同谱"现象特别严重,仅靠地物光谱特征统计提取土地利用信息存在明显缺陷与不足,探索符合特定区域的基于多元方法耦合的土地利用信息提取模型显得非常必要,可为复杂土地利用信息提取提供便捷通道.本文首先找出典型土地利用类型的光谱特征和归一化差异型指数变化规律,再运用交互式数据语言耦合光谱信息并建立决策函数,对1993年、2001年和2009年3期TM影像进行决策树分类,以自动提取三峡库区回水淹没与快速城市化重叠区这一高强度人为扰动复合区典型土地利用信息.结果表明:典型地类的波谱响应曲线和归一化差异型指数曲线分布形态符合于地表三大基本地类特征,以此验证了研究中所选取的三种指数的合理性和各地类样区选择的有效性;各地类在TM影像1、2、3波段上因光谱特征变化趋势无明显差异、相关性较强而不易于提取,3、4、5波段光谱特征因差异变化最大、所包含的土地利用信息最为丰富而更易于提取样区典型地类;三种指数及其差值组合指数的曲线分布形态及其值变化与研究区的实际地类变化较为吻合;多元方法耦合的决策树分类比监督分类方法在提取土地利用信息上具有更高的精度,在样区土地利用自动分类中是一种低成本、易实现和推广的有效方法,从1993年、2001年和2009年总体分类精度分别提高了18.46%、15.43%和24.18%.据此,基于多元方法耦合的决策树分类模型能为三峡库区人为扰动复合区土地利用信息提取提供一可操作途径,为整个三峡库区土地利用信息自动提取提供已有方法的整合思路. 相似文献
16.
积雪面积是融雪径流模型中变量数据输入之一,准确的获取雪盖范围是进行流域尺度融雪水文过程研究的关键,在水资源管理及洪水预报中具有重要意义.本文以天山山区中段为例,利用MODIS数据,提出了结合混合光谱分解的积雪分量及灰度共生矩阵提取的纹理特征的SVM分类方法,对研究区积雪面积信息提取进行了研究.结果表明:通过利用混合光谱分解的积雪分量作为SVM的特征输入,总体分类精度比传统SVM分类结果有了一些提高.同时考虑结合基于灰度共生矩阵提取的纹理特征用于分类中,总体精度比传统SVM方法提高了1.081%,制图精度达到了99.01%.本文提出的分类方法能够适应特征组合之间的非线性关系,从而能提供更多的区域地物空间分布信息,能够调整无样本地表类型地区的积雪面积反演,对今后的融雪水文过程研究有重要意义. 相似文献
17.
18.
19.
基于支持向量机的土地覆被遥感分类 总被引:4,自引:0,他引:4
遥感图像的分类是研究土地变化的基础。传统的遥感图像分类存在着精度不高,不确定性强的特点。本文使用支持向量机(SVM,Support Vector Machine)技术对遥感图像分类,并与传统的最大似然分类进行对比试验。结果表明不同参数组合下SVM的分类总精度和Kappa指数普遍高于最大似然分类的结果,其最高总精度高出最大似然分类0.9779%。SVM和最大似然分类结果都存在着类别混分,但是SVM混分程度远小于最大似然分类,其精度保持在可接受的范围内,如对于低密度草而言,最大似然分类的用户精度下降到84.68%,而支持向量机的用户精度虽然也有下降但还是保持在92.31%。SVM在样本数目很少的情况下表现出了出色的学习能力,是机器学习领域很有希望的一种学习方法。 相似文献