首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
集成学习算法的效果取决于各个基分类器,如何构造有效的基分类器是关键。对集成学习算法中的Bagging算法进行了研究,提出了一种基于层次抽样构造SVM基分类器的方法进行P2P流分类,并通过实验验证了该方法的有效性。  相似文献   

2.
集成分类器是目前隐写分析中的常用分类器。为进一步增强集成分类器在隐写分析中的检测精度,在Bagging集成的基础上提出了一种改进的样本抽取方法,该算法在保留一定差异性的同时,增加了基分类器之间的互补性。实验表明:与原始的集成分类器相比,本文提出的方法能够降低检测错误率。  相似文献   

3.
运用集成分类算法bagging的改进模型——subagging试图建立一个专门针对个人信用评估的方法,以期取得更好的预测分类效果.针对个人信用评估中单一分类器的不足,提出了利用分类器的集成进行个人信用评估的方法.利用UCI上的信用数据对单个分类器、bagging集成分类器以及subagging集成分类器进行实验比较,结果表明,subagging -决策树和subagging -K近邻在样本不独立和不平衡的情况下有效地提高了模型的精准性.结果显示,它们对商业银行控制消费信贷风险具有更好的适用性.  相似文献   

4.
集成学习算法是机器学习领域中用来提高分类器泛化性能的流行算法。本文利用平安人寿保险股份有限公司的实际业务数据,采用数据挖掘算法中的集成算法,建立公司少儿险产品的多个推荐模型。该系列模型对比常见的分类方法如逻辑回归构建的模型,在深度较小时,预测精度有所提升,能够更加准确地挖掘出购买客户,实现精准营销。  相似文献   

5.
梁明江  庄宇 《软科学》2012,26(4):114-117
以我国制造业上市公司为样本数据,用支持向量机作为基分类器的集成学习方法来预测企业的财务危机,通过具体实验分析可知:集成学习比单个基分类器的预测准确率提高了4个百分点,且稳定性更高,有效地提高了模型的预测精度,使得模型更具有准确性和应用性。基于支持向量机的集成学习方法在构建我国制造业上市公司财务危机预警模型上是有效的,且达到一定的财务危机预警效果。  相似文献   

6.
将图像的像素特征与矩特征结合,构建了神经网络分类器,利用提取的特征向量对分类器进行了训练和测试。将图像二值化,并归一化为16*16大小,提取了其每个像素点的0、1特征共16*16—256维,图像的网格特征13维,及Hu矩特征7维,一共276维特征。建立了BP神经网络分类器,分别使用最速下降BP算法、动量BP算法、学习率可变BP算法对BP神经网络分类器进行了训练,得出了在相同条件下学习率可变BP算法训练时间短,收敛快的结论。建立了PNN神经网络分类器,与BP神经网络分类器性能进行比较,实验结果表明,PNN神经网络分类器性能更好。  相似文献   

7.
王文震 《科技通报》2012,28(10):46-48
提出了一种基于流形学习的视频中文文本检测算法.算法重点针对文本图像和非文本图像的特征提取、流形降维、分类器训练等关键部分进行了改进,对人为收集的文本图像样本与非文本图像样本进行特征提取,并使用等距离映射的流形学习算法来完成特征降维,最后使用支持向量机来完成分类器训练,获取文本与非文本检测分类器,完成视频中文文本检测.实验结果表明,算法具有明显优越性,在检测可靠性和准确度上有较大提高,具有一定的实用意义.  相似文献   

8.
基于VSM的文本分类挖掘算法综述   总被引:2,自引:0,他引:2  
简要介绍了VSM和文本分类挖掘的流程,分析了基于统计方法和基于机器学习的6种常用构造文本分类挖掘分类器的算法,指出了利用各种算法构造的分类器的特点,同时给出了这些算法的优化方向,为使用者选择、学习、改进算法提供依据。  相似文献   

9.
许多现实应用中,由于数据流的特性,使人们难以获得全部数据的类标签。为了解决类标签不完整数据流的分类问题,本文首先分析了有标签数据集对基于聚类假设半监督分类算法分类误差的影响;然后,利用分类误差影响分析以及数据流的特点,提出一种基于聚类假设半监督数据流集成分类器算法(semi-supervised data stream ensemble classifiers under the cluster assumption,SSDSEC),并针对个体分类器的权值设定进行了探讨;最后,利用仿真实验验证本文算法的有效性。  相似文献   

10.
手写汉字识别是大类别分类识别问题,文章针对金融票据自动识别应用中的脱机手写体汉字,给出了一种基于多层BP网络的并行集成方法。该方法是纯神经网络的多分类器并行集成方案,通过一个两步监督学习过程实现整个集成网络分类系统。对BP网络的应用做了有益的探索,同时也为BP网络在大类别分类问题中的应用提供了一条可行的途径。  相似文献   

11.
黄静  薛书田  肖进 《软科学》2017,(7):131-134
将半监督学习技术与多分类器集成模型Bagging相结合,构建类别分布不平衡环境下基于Bagging的半监督集成模型(SSEBI),综合利用有、无类别标签的样本来提高模型的性能.该模型主要包括三个阶段:(1)从无类别标签数据集中选择性标记一部分样本并训练若干个基本分类器;(2)使用训练好的基本分类器对测试集样本进行分类;(3)对分类结果进行集成得到最终分类结果.在五个客户信用评估数据集上进行实证分析,结果表明本研究提出的SSEBI模型的有效性.  相似文献   

12.
可融资性是PPP可持续发展的前提和基础.针对PPP项目可融资性存在行业差异性高及评价类别型字段过多问题,为防止评估过程出现严重过拟合现象和因二次加工产生的误差,提出集成LightGBM-Blending算法.基于社会资本视角构建可融资性评估体系,借鉴集成思想按行业划分训练集,构建以LightGBM算法为基础的多基分类器...  相似文献   

13.
线性分类器作为理解最简单表现最直观的算法之一,在众多更新更复杂的算法的涌现之后,依然在模式识别的应用中有一席之地,有被学习的必要。本文首先建立了一个完整的线性分类器进行手写数字识别,使用MATLAB的研究环境和MNIST的手写数据库样本。首先对于待识别的样本进行预处理,建立线性分类器,使用样本集进行训练并分类,再使用测试集得到其分类效果的数据。为了不同模式识别样本的性能,本文选取了K均值聚类,BP神经网络和SVM算法,分别建立了分类器后,使用相同的样本集进行训练并测试其性能,从识别速度和准确性进行比较。最后本文对不同算法的测试效果进行比较,总结,分析各个识别算法的优劣。建立用户界面直观反映各个分类器的优劣和使用效果。  相似文献   

14.
为提高集成分类器在图像隐写分析中的检测,针对传统集成分类器中简单投票方法无法体现基分类器差异性这一缺点,提出一种基于加权投票的图像隐写分析方法。首先基于随机森林的方式生成若干基分类器,然后计算每一个基分类器的投票权值并使用加权投票的方式得到最终的结果。实验结果表明,该方法能够提高集成分类器的检测精度。  相似文献   

15.
由于气体具有易扩散和易混合的特点,在人工嗅觉识别过程中,存在训练样本少和分类器建立困难的问题,为此,采用支持向量机这一基于小样本统计学习理论建立非线性分类器的学习算法.针对样本数目偏少的实际情况,建立了一种人工嗅觉分类器,并对好、坏、仿坏三种类别的甘草进行了分类验证.结果表明,支持向量机应用于人工嗅觉,能够取得比较好的分类效果.  相似文献   

16.
目的:讨论Bagging、Adaboost、Random Forest(RF) 3个集成分类器对新疆哈萨克族食管图像分型中的分类能力。方法:使用Matlab图像处理软件,对食管X线图像进行预处理,对预处理后的图像使用灰度共生矩阵和Hu不变矩特征进行图像特征的提取;然后,使用主成分分析法对特征值进行筛选优化,得到分类能力较强的特征值;最后,使用Weka软件,将3个不同的集成分类器对正常食管和早期食管癌图像进行分类,并进行分类模型的评估。结果:使用Bagging、Adaboost、Random Forest(RF) 3个集成分类器结合降维后的灰度共生矩阵特征值对食管图像进行分类时,正常食管的分类准确率是82%、94%、88%,早期食管癌的分类准确率是94%、88%和94%;使用降维后的Hu不变矩特征值和3种集成分类器对正常食管和早期食管癌进行分类时,正常食管的分类准确率是60%和64%、61%,早期食管癌的分类准确率是57%、68%和65%;结论:3种集成分类器结合灰度共生矩阵对正常食管和早期食管癌X线图像进行分类,其分类准确率与Hu不变矩相比分类效果更显著。说明灰度共生矩阵结合3种集成分类器更适合用于区分正常食管和早期食管癌X线图像。  相似文献   

17.
贝叶斯分类器可以归结为求词条的先验概率,目前分类器中普遍使用词条的文档出现次数和词频来计算先验概率.本文提出了一种基于权重的朴素贝叶斯分类器,不仅改进了文本中词条的先验概率计算方式,并增加了词条的权重对计算的影响.该分类器使用TFIDF模型及其改进算法实现了分类器的设计.实验结果表明,该分类器的效果比传统算法有较大的改进.  相似文献   

18.
王仕俊  平常  薛国斌 《科技通报》2019,35(11):135-138,142
针对目前在局部放电模式识别领域中常用的分类器算法的缺陷,本文研究随机森林(random forest,RF)算法在局部电放模式识别领域的应用。首先对局部放电试验数据提取统计特征量,构建放电的学习样本。利用十折法对算法分类性能进行评判,并比较常见分类算法BP神经网络、支持向量机(support vector machine,SVM))、KNN、分类回归树算法(classification and regression tree,CART)以及RF算法的识别准确率。结果表明:利用RF算法构建放电模式分类器的识别准确率最高。此外,利用组成RF的基分类算法CART可分析不同放电模式间的主要区别。  相似文献   

19.
吴冲  夏晗 《预测》2009,28(4):57-61
研究表明支持向量机集成方法可以提高分类精度,但是目前所用的基于最多投票原则的集成策略无法评价单个支持向量机分类器的输出重要性.针对这个问题,本文建立一种基于五级分类的支持向量机集成方法,该方法具有四个因子输入,一个衡量商业银行信用风险的输出,该方法考虑了各子分类器的分类结果和各子分类器判决对最终决策的重要程度,利用Libsvm对某商业银行信贷的176组样本数据进行实证分析,结果表明本文提出的方法比其他分类方法的分类精度高,证实了该方法的可行性和有效性,为银行建立可靠的评估系统提供了依据.  相似文献   

20.
基于贝叶斯网的分类器因其对不确定性问题有较强的处理能力,因此在CRM客户建模中有其独特的优势。在对朴素贝叶斯分类器通用贝叶斯分类器优缺点分析的基础上,引入增强型BN分类器和贝叶斯多网分类器,详细介绍了后者的算法,并将其应用到实际电信CRM客户建模中,取得较好的效果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号