首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
提出一种基于Boosting BP神经网络的交通事件检测方法.以上下游的流量和占有率作为特征,BP神经网络作为分类器进行交通事件的自动分类与检测.为了进一步提高神经网络的泛化能力,采用一种调整权值分布,限制权重扩张的改进的Boosting方法,分类器以加权投票方式进行分类决策.实验结果表明该交通事件检测算法是有效的.  相似文献   

2.
在不均衡数据集下,SVM分类超平面的偏移,使得基于KKT条件进行样本选择的增量学习算法性能不佳,针对该问题,提出动态代价的SVM增量学习算法,该算法依据各类样本密度之间的关系动态计算类的错分代价,减少每次迭代中分类超平面偏移造成的错误累积,保证依据KKT条件选取样本的准确性,使得每次迭代选取的样本都包含当前分类器缺少的空间信息,提高最终分类器在不均衡数据集下的分类性能。最后,在UCI数据集上的仿真实验结果表明该算法能够提高不均衡数据下的分类性能。  相似文献   

3.
《嘉应学院学报》2016,(5):16-20
针对传统Android恶意应用检测方法在处理大规模样本时存在的训练时间长、存储空间消耗大的问题,提出一种基于增量学习SVM的Android恶意应用检测方法.该方法提取Android应用的权限申请和API函数调用特征,利用增量学习SVM理论将训练样本集随机划分为初始样本集和若干个增量样本集,利用循环迭代方法训练SVM分类器,每次新的训练仅保留上一轮训练得到的支持向量集并合并到新增样本集中,舍弃大量对分类结果不产生影响的样本以提高分类器学习效率,同时产生新的支持向量集,并最终得到一个高精度的SVM分类器.通过将增量学习SVM算法与基本SVM算法进行对比实验,结果表明,该算法可以有效降低分类器学习时间,减少样本存储的空间占用,同时随着样本规模的积累逐步提高分类精度.  相似文献   

4.
针对传统的特征选择方法在非平衡数据集中分类效果不理想的问题,提出了一种适合非平衡数据分类的改进特征选择方法.该方法将集中度和分散度相结合,同时考虑到在文本长短不一时词频对文本分类的作用,得到一种新的词频归一化方法,实现了对传统特征提取方法的改进.另一方面,将三支决策思想引入到朴素贝叶斯算法,得到了NB-三支决策分类算法,并将该算法应用到非平衡数据集的分类.通过两组实验对比结果表明:改进特征选择方法较CHI和IG方法,处理非平衡度高的数据集分类效果较好;选取相同的特征选择方法和数据集,NB-三支分类器比NB-分类器的分类效果好.选用本文提出的改进特征选择方法和NB-三支分类器,在处理非平衡度高且文本长短不一的数据集时,分类效果有一定提升.  相似文献   

5.
SVM算法只使用已归类的数据训练分类器,而EM算法用少量已归类数据,结合大量的未归类数据来训练分类器,在减少已归类数据的同时保证了分类器的精度。本文基于EM算法的思想,根据SVM文本分类模型,提出一种新的迭代SVM文本分类算法。实验结果表明,迭代SVM算法分类精度高于传统的SVM文本分类算法,具有较好的性能。  相似文献   

6.
不平衡数据在各个应用领域普遍存在。在处理不平衡数据时,破坏原始数据的分布特点和丢弃多数类样本的潜在信息都会降低分类精度,为此,提出一种不平衡数据集成分类方法。从多数类样本中依据计算得到的综合权重进行随机采样,并与少数类样本组成新的训练样本子集|为了保证基分类器的差异性,将投影得到的不同样本子集作为各个基分类器的训练样本,通过多分类器集成学习获得最终分类结果|在UCI数据集下进行实验。结果表明,该方法不仅能够提高少数类样本的分类性能,而且能够有效提高整体分类精度。  相似文献   

7.
构造性学习(CML)算法训练分类器对有些样本会有“拒认状态”,构造性学习算法中对这一状况的处理使用就近原则,然而,这种方法无法体现数据之间的联系.为了能更好地体现数据间的联系,提出了人脑分类机理的构造性学习方法(HB-CML).在测试阶段,把测试样本、训练样本都考虑进来,利用人脑对数据的自动分类机理,对“拒认状态”样本进行分类标记.同时,选取UCI数据集进行实验.结果表明:与CML算法相比,该方法的分类更为有效.  相似文献   

8.
提出了一个基于统计分析的数据分类算法.通过使用从训练集中提取的信息,对支持集选择问题进行建模,以得到具有良好分离能力的小型支持集.采用混合整数规划模型计算最优的权重值和分类阈值,通过将样式加权和与分类阈值进行比较来对数据进行分类.并使用真实数据集对本算法进行性能评估.实验结果表明:本算法不仅能提高分类的精度,还能有效减少分类所需的计算时间.  相似文献   

9.
应用粗糙集理论,提出了一种新的多变量决策树构造算法.该算法以核相对于决策类的泛化来划分样本集,如果所划分子集的样本存在不一致决策类并且未用于划分的属性为空时,试探着分别把该子集和一致性子集合并,计算各合并子集的条件类对决策类的确定性程度,选择确定性程度大的作为同一子集,并用一致性子集的类标号进行标示.和苗夺谦提出的多变量决策树算法比较,本算法充分考虑了训练集中的噪声数据,允许在构造决策树的过程中划入正域的实例类别存在一定的不一致性,可简化生成的决策树,提高决策树的泛化能力.  相似文献   

10.
常用的网页分类技术大多基于普通文本分类方法,没有充分考虑到网页分类的特殊性--网页本身的半结构化特征以及网页中存在大量干扰分类的噪音信息,同时多数网页分类的测试集和训练集采源于同一个样本集而忽视了测试集中可能包含无类别样本的可能.基于向量空间模型,将样本集看成由有类别样本和无类别样本两部分组成,同时选择了样本集来自于相同的网站,在去除网页噪音基础上结合文本相似度算法和最优截尾法,提出了一种基于不完整数据集的网页分类技术LUD(Learning by Unlabeled Data)来改善分类效果,提高分类精度.实验证明:LUD算法与传统的分类方法相比较而言,不但可以提高已有类别样本的分类精度,更主要的是提供了一种发现新类别样本的方法.  相似文献   

11.
传统欠采样方法在处理不平衡数据问题时只考虑多数类样本的绝对位置而忽略了其相对位置,从而使产生的平衡数据集存在边界模糊问题。提出一种改进 K 均值聚类的不平衡数据欠采样算法(UD-PK)。该算法首先利用改进的 PSO 算法迭代寻找全局最优解作为 K-means 聚类所需初始值,然后通过 K-means 进行聚类,再按照每个类别中多数类与少数类的比例定义所取多数类样本个数,并根据多数类样本与簇心距离择优选择参与平衡数据集构造。在 UCI 数据集上的对比试验表明,该算法在少数类准确率上较一些经典算法有很大提升。  相似文献   

12.
基于可调子块迭代的加速SAGE算法在PET图像重建中的应用   总被引:1,自引:0,他引:1  
提出了一种可调子块迭代(RBI)方法加速空间交替广义期望最大(SAGE)算法的收敛性.新的可调子块迭代的空间交替广义期望最大算法(RBI-SAGE)组合了RBI算法和SAGE算法的优点用于加速正电子发射断层(PET)图像重建.RBI-SAGE将投影数据分成不连续的子块,每一次迭代仅包含一个这样的子块.在每一个子块中用SAGE算法序列更新参数.实验中,运用RBI-SAGE算法与SAGE算法对PET图像进行重建.结果表明,RBI-SAGE收敛性能比SAGE算法优越,且重建图像质量较高.  相似文献   

13.
传统图像特征提取具有较高维度缺陷,造成算法分类效率低、复杂度高、分类速度慢、计算开销大等问题.为此提出AAM算法,定位关键点提取人脸表情几何特征.将朴素贝叶斯分类器结合特征属性重要度调节高斯核函数,使用K近邻算法实现分类决策,提出一种WNBC-KNN分类方法,从降低数据维度和分类算法两方面优化人脸表情分类.在CK+数据...  相似文献   

14.
针对古漆器漆膜数据类间不平衡、样本规模小,以及传统机器学习算法分类效果较差的问题,提出一种改进SMOTE的过采样方法改变漆器漆膜数据样本分布,使其达到平衡.该方法通过比较各类样本间的欧式距离,删除了人工样本中的噪声数据,然后运用集成学习中的随机森林算法进行分类,提高了少数类的分类准确率.UCI数据集上的实验结果表明,改...  相似文献   

15.
基于模糊观测数据的RBF神经网络回归模型   总被引:1,自引:0,他引:1  
提出了一种基于模糊观测数据的RBF神经网络(FORBFNN),用于解决一类输出不可精确测量但可用模糊隶属度来表征的非线性系统建模问题.神经网络模型中各隐层神经单元的权重系数采用一种新的模糊EM算法辨识获得;隐层神经单元的数量及径向基函数的中心和宽度基于一种数据驱动的方法自适应确定,即首先初始生成一个隐层单元,然后根据一定的规则逐步加入新的单元,该过程不断迭代直到模型满足预设要求.该方法同时考虑了模型的复杂度及预测精度.数值模拟实验结果表明该建模方法是有效的,且建立的模型具有较高的预测精度.  相似文献   

16.
提出一种新的纠正CORDIC算法中模因子的方法以解决传统方法所带来的电路结构不规则、系统吞吐率降低等弊端.首先根据迭代方程之间的关系,通过推导引入一个新的迭代方程,将模因子的校正过程转化为只需要移位和加法运算即可实现的简单的迭代过程.然后分析了该算法量化误差中的舍入误差所带来的影响,并提出该误差可以通过对迭代方程中的系数进行合适取值来降低.最后对提出的算法通过Matlab建模并利用Verilog HDL语言进行RTL级编程,经过综合后在FPGA上进行了验证.仿真结果表明,与传统方法相比,在相同精度条件下使用所提方法只需要额外的一个时钟周期即可达到模校正的目的,且不需要修改基本的迭代操作.因此电路实现比较规则,同时系统吞吐率变化较小.  相似文献   

17.
在MATLAB环境下,取ORL人脸数据库的部分人脸样本集,基于PCA方法提取人脸特征,形成特征脸空间,然后将每个人脸样本投影到该空间得到一投影系数向量,该投影系数向量在一个低维空间表述了一个人脸样本,这样就得到了训练样本集。同时将另一部分ORL人脸数据库的人脸作同样处理得到测试样本集。然后基于最近邻算法进行分类,得到识别率,接下来使用BP神经网络算法进行人脸识别,最后通过基于神经网络算法和最近邻算法进行综合决策,对待识别的人脸进行分类。  相似文献   

18.
线性规划非单调一阶段算法   总被引:2,自引:0,他引:2  
为了获取计算的高效率,有必要修正单纯形算法的原则.本提出了一个新的单纯形一阶段算法.与传统单纯形算法不同的是,新算法不仅不要求目标函数值单调变化,且在一阶段的迭代过程中也不必保持变量的可行性,而是采用纯组合的方法去达到可行.这样摆脱了迭代时的比值检验,减少了每次迭代的计算工组量.理论分析及数值计算结果表明新算法的前景令人鼓舞.  相似文献   

19.
传统的机器学习和数据挖掘分类算法是在假设数据是完整精确的前提下进行的,然而在实际的应用中,由于数据存在不确定性,使这种假设很难成立.数据的不确定性可能是由多种原因导致的,比如测量错误、隐私保护以及传感器搜集的不确定信息等等.本文研究在不确定数据中使用朴素贝叶斯分类方法进行分类问题.  相似文献   

20.
电类实验教学过程中人工评判学生所测数据工作烦琐,影响了教学质量和效率。该文提出了改进的K近邻(K-nearest neighbors,KNN)分类算法,即基于均值漂移、安全间隔和核主成分分析(KPCA)的M-KPCA-KNN(KNN based on margin and KPCA)算法,以判断学生测量数据正确与否和错误原因。首先利用KPCA对高维实验数据进行降维,然后利用均值漂移向量找到不同类别数据的最密集位置,并在不同类别数据的边界设置安全间隔,最后,将与待测样本距离最近的k个数据设置权重,计算每个类别的权重和,权重和最大的类别为待测样本的类别。与现有的KNN算法相比,M-KPCA-KNN算法不仅提高了分类正确率,而且降低了时间复杂度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号