首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 250 毫秒
1.
王仕俊  平常  薛国斌 《科技通报》2019,35(11):135-138,142
针对目前在局部放电模式识别领域中常用的分类器算法的缺陷,本文研究随机森林(random forest,RF)算法在局部电放模式识别领域的应用。首先对局部放电试验数据提取统计特征量,构建放电的学习样本。利用十折法对算法分类性能进行评判,并比较常见分类算法BP神经网络、支持向量机(support vector machine,SVM))、KNN、分类回归树算法(classification and regression tree,CART)以及RF算法的识别准确率。结果表明:利用RF算法构建放电模式分类器的识别准确率最高。此外,利用组成RF的基分类算法CART可分析不同放电模式间的主要区别。  相似文献   

2.
线性判别分析(LDA)具有很好的分类性能,但是计算复杂度一般较高。为了有效地降低LDA算法的计算复杂度,本文提出了一种基于k-means聚类的快速学习算法。该算法首先根据k-means聚类算法对原始样本进行聚类,计算聚类簇的样本中心作为新训练样本,然后再利用LDA算法进行分类。由于通过聚类算法有效地压缩了训练样本集的规模,因此算法具有更高的效率。在语音识别数据集上的实验充分验证了本文算法具有较好的分类性能,而且效率更高。  相似文献   

3.
萧莉明  于宽  蔡珣 《现代情报》2007,27(4):146-147,150
本文设计了一个有效的基于贝叶斯分类器的中文期刊自动分类系统。首先,该系统以期刊的名称作为惟一的标引内容,并利用自动分词技术将期刊名称分成待分类的样本集;其次,通过对图书馆的样本数据进行训练建立的分类库,本文使用贝叶斯分类器实现中文期刊的自动分类。实验结果表明,该分类器对中文期刊的分类具有很好的高效性和准确性。  相似文献   

4.
黄静  薛书田  肖进 《软科学》2017,(7):131-134
将半监督学习技术与多分类器集成模型Bagging相结合,构建类别分布不平衡环境下基于Bagging的半监督集成模型(SSEBI),综合利用有、无类别标签的样本来提高模型的性能.该模型主要包括三个阶段:(1)从无类别标签数据集中选择性标记一部分样本并训练若干个基本分类器;(2)使用训练好的基本分类器对测试集样本进行分类;(3)对分类结果进行集成得到最终分类结果.在五个客户信用评估数据集上进行实证分析,结果表明本研究提出的SSEBI模型的有效性.  相似文献   

5.
基于Hopfield的脱机手写数字识别理论及算法   总被引:1,自引:0,他引:1  
脱机手写数字识别在很多领域具有广泛的应用前景,国内外学者对此做了大量的研究工作,提出了很多预处理和模式识别的算法,大大提高了手写数字的识别精度。为了提高手写数字识别的精度,本文将Hopfield神经网络应用于脱机手写数字识别分析中,Hopfield神经网络的“能量函数”的能量在网络运行过程中,具有不断地减少最后趋于稳定的平衡状态的特性,而且网络一旦建立即可自动运行,无需训练。脱机手写数字的识别过程分为两步:训练阶段,识别阶段。在训练阶段,提取训练样本集的代数特征,建立网络模型,以输八向量为目标向量,保存网络连接权值和闺值以及代数特征;在识别阶段,将待识别数字特征送入网络运行,待网络运行到平衡状态后,将输出结果与数字特征库的向量进行比较,距离最小者即为待识别的数字。  相似文献   

6.
本文提出了一种基于训练集划分的随机森林算法。该算法首先将多数类划分为多个不相交子集。然后将每个子集与少数类合并,进行决策树的训练。最后根据平均加权策略构建随机森林,并获取最终的分类规则。本文所提方法避免了原始样本信息的损失,而且保持了子分类器的样本平衡。在人工生成数据集上的仿真实验表明本文方法非常有效。  相似文献   

7.
【目的/意义】数据分类是数据挖掘研究的重要内容之一。数据分类时,由于单一分类算法分类性能的差异 性,使其不能很好地解决大部分的分类问题,探讨一种基于多类型分类器装袋技术的数据分类方法具有重要理论 意义和应用价值。【方法/过程】基于分类性能评价的准确率,使用五种不同类型的分类算法作为分类器,随机抽取 训练集后分别训练得到若干个弱分类器,然后采用自动优化加权方式,组合构建一个强的分类器。通过实验对五 种分类算法和装袋算法的分类准确率均值和标准差分别进行对比,得出各分类算法在四种数据集上分类性能的优 劣和稳定性。【结果/结论】在四个UCI数据集上的实验结果表明,与五种不同类型的分类算法相比,装袋算法不仅 在大部分数据集上都表现出很好的稳定性,而且具有更好的泛化能力。  相似文献   

8.
研究了利用支持向量机分类器进行手写体数字识别的技术。构建了我国邮政手写数字库和美国邮政手写数字库。在此库上,利用基于SVM多类分类器进行了实验,并与其他分类器的识别方法进行了比较。实验结果表明,算法的正确识别率达到96.005%,识别效果最好。  相似文献   

9.
借助文本分类系统软件,采用来自10个大类的中文文本数据,按照训练集与测试集2:1的比例,使用KNN和SVM分类算法,对数据集进行自动分类的实验。旨在通过具体的语料库实验,探讨文本自动分类的关键技术,分析、比较与评价实验结果,探讨文本分类中具体参数的设置和不同分类算法之优劣。  相似文献   

10.
由于气体具有易扩散和易混合的特点,在人工嗅觉识别过程中,存在训练样本少和分类器建立困难的问题,为此,采用支持向量机这一基于小样本统计学习理论建立非线性分类器的学习算法.针对样本数目偏少的实际情况,建立了一种人工嗅觉分类器,并对好、坏、仿坏三种类别的甘草进行了分类验证.结果表明,支持向量机应用于人工嗅觉,能够取得比较好的分类效果.  相似文献   

11.
支持向量机是一种基于统计学习理论的机器学习方法,针对小样本情况表现出了优良的性能,目前被广泛应用于模式识别、函数回归、故障诊断等方面。这里主要研究支持向量机分类问题,着重讨论了以下几个方面的内容。首先介绍了支持向量机分类器算法,并将其应用于数据分类,取得了较高的准确率,所用数据来自于UCI数据集。仿真结果表明该算法具有较快的收敛速度和较高的计算精度。  相似文献   

12.
为了解决传统车辆检测存在的问题,提高车辆检测的准确度,本文提出将区域卷积神经网络算法应用到车辆检测中。该算法利用图像的颜色层次特征,获取潜在的车辆候选区域;建立卷积神经网络结构,使用车辆样本库进行特征训练,提取候选区域特征;选定正负样本进行SVM分类器训练,采用SVM分类器进行最终的候选区域分类,最后得到车辆信息。本文使用的算法能够检测出图像中的车辆,剔除非车辆区域,有效提高车辆检测的准确性,并且具有一定的实时性。  相似文献   

13.
为了对垃圾评论观点进行识别,本文基于隐马尔科夫模型和贝叶斯算法实现了一种对垃圾观点识别的分类器。首先,将要识别的语句提出出来,用隐马尔科夫模型进行分词,然后再根据分词结果,使用贝叶斯算法对其进行分类,以苹果i Phone 6(全网通)的27条评论作为测试,该分类器对其中的20条进行了正确的分类,其准确率达到74.07%,并分析了此结果的原因,同时也提出了提高准确率的办法。  相似文献   

14.
将图像的像素特征与矩特征结合,构建了神经网络分类器,利用提取的特征向量对分类器进行了训练和测试。将图像二值化,并归一化为16*16大小,提取了其每个像素点的0、1特征共16*16—256维,图像的网格特征13维,及Hu矩特征7维,一共276维特征。建立了BP神经网络分类器,分别使用最速下降BP算法、动量BP算法、学习率可变BP算法对BP神经网络分类器进行了训练,得出了在相同条件下学习率可变BP算法训练时间短,收敛快的结论。建立了PNN神经网络分类器,与BP神经网络分类器性能进行比较,实验结果表明,PNN神经网络分类器性能更好。  相似文献   

15.
在MATLAB环境下,取ORL人脸数据库的部分人脸样本集,基于PCA方法提取人脸特征,形成特征脸空间,然后将每个人脸样本投影到该空间得到一投影系数向量,该投影系数向量在一个低维空间表述了一个人脸样本,这样就得到了训练样本集。同时将另一部分ORL人脸数据库的人脸作同样处理得到测试样本集。然后基于最近邻算法进行分类,得到识别率,接下来使用BP神经网络算法进行人脸识别,最后通过基于神经网络算法和最近邻算法进行综合决策,对待识别的人脸进行分类。  相似文献   

16.
可融资性难问题持续制约PPP健康发展,社会资本往往从项目本身和地方政府两个维度评价PPP项目可融资性。通过综合比较主流样本合成算法在合成样本的精细度以及分类器算法对非平衡样本集少数类样本识别能力,针对CPPPC库中PPP案例样本数据非平衡性及高噪声异质性,提出Borderline-SMOTE Bagging算法,对四组PPP项目进行可融资性评价。研究结果表明:基于数据挖掘算法对PPP可融资性进行评价具备可行性;针对PPP非平衡数据集问题,Borderline-SMOTE Bagging算法具备良好的样本分类能力和优秀的泛化能力,能有效降低因合成样本形成的噪音所带来的负面影响,且具备良好的少数类样本识别能力。  相似文献   

17.
本文提出了基于RBF神经网络进行汽轮机故障诊断的方法.首先建立了神经网络的诊断模型,然后利用某汽轮机的样本集对一个单隐层的RBF网络进行训练.最后,通过测试网络,验证该网络对于故障模式的识别准率较高.  相似文献   

18.
行人再识别是计算机视觉研究领域的一个研究热点。现有度量模型存在过拟合现象,本文建立了基于正态性重采样的线性判别分析算法,通过局部相似性约束,训练行人再识别的度量模型。该模型通过半监督学习提升算法的泛化能力。最后,通过VIPeR和CUHK01数据集的测试对本文算法的鲁棒性和有效性进行了验证。  相似文献   

19.
常用的网页分类技术大多基于普通文本分类方法,没有充分考虑到网页分类的特殊性——网页本身的半结构化特征以及网页中存在大量干扰分类的噪音信息,同时多数网页分类的测试集和训练集来源于同一个样本集而忽视了测试集中可能包含无类别样本的可能。基于向量空间模型,将样本集看成由有类别样本和无类别样本两部分组成,同时选择了样本集来自于相同的网站,在去除网页噪音基础上结合文本相似度算法和最优截尾法,提出了一种基于不完整数据集的网页分类技术LUD(Learning by Unlabeled Data)来改善分类效果,提高分类精度。实验证明:LUD算法与传统的分类方法相比较而言,不但可以提高已有类别样本的分类精度,更主要的是提供了一种发现新类别样本的方法。  相似文献   

20.
为了提高最小距离分类器的性能,在其基础上提出了一种改进MDC——NN-MDC:它先对训练样本进行修剪,根据每个样本与其最近邻类标的异同决定其取舍,然后再用剩余的训练样本训练得到分类器。采用UCI标准数据集实验,结果表明本文所提出的NN-MDC与MDC相比具有较高的分类精度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号