首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 180 毫秒
1.
准确的流量分类是网络管理和网络安全的有效保障。近年来基于机器学习的网络流量分类备受关注,特征选择对于机器学习的分类效果有重要影响。但使整体分类性能达到最优的特征选择子集,并不一定使特定类别的分类性能达到最佳,这降低了分类性能可达到的上限,对此提出基于改进的一对一算法的流量分类模型。首先采用一对一的思想将流量多分类任务拆解为多个相互独立的二分类子任务,分别对任意两类流量进行特征选择和流量分类。所有子任务的分类结果采用Stacking策略结合。实验表明,多种机器学习算法与特征选择算法应用于该模型的准确度较经典模型均有提升。  相似文献   

2.
为在中文网页分类时降低特征向量的维度、提高分类的精度,采用一种基于关联的特征选择(Correlation-based Feature Selection,CFS)与遗传算法(Genetic Algorithm,GA)相结合的方法进行特征选择.在该算法中,特征子集被当作GA中的一个染色体进行二进制编码;利用CFS启发值作为GA的适应度函数对个体进行评价;CFS值越大的个体遗传到下一代的概率越大.结合GA的全局搜索特性,该算法可保证所得特征子集是全局最优的.利用weka平台,对搜狗实验室提供的中文网页数据集进行实验.结果表明,该算法能有效降低特征空间的维度、提高分类精度。  相似文献   

3.
提出一种基于特征筛选和二级分类的建筑提取算法。该算法首先对极化SAR数据进行精致Lee滤波,获取多维极化特征和纹理特征构成原始特征集;然后将随机森林作为初级分类器评估各特征的重要性,依据重要性排名进行特征筛选;最后通过支持向量机对特征子集进行次级分类,并用邻域投票法将两级分类结果融合。AIRSAR极化数据实验结果表明,本算法可有效提高极化SAR建筑提取准确率。  相似文献   

4.
关联规则挖掘是数据挖掘领域的一个重要研究课题,目的在于从大量的数据库记录或交易中发现所有频繁出现的项目子集,并以规则形式给出项目子集之间的相互影响关系.但是用传统关联规则生成方法所生成的规则一是数量庞大,二是其中包含许多具有相同意义的规则,这必然对用户理解和提取信息带来干扰.本文通过引入同组项目集概念定义了冗余规则类型,并给出了有效排冗关联规则挖掘算法.  相似文献   

5.
航海视景仿真的海浪生成算法   总被引:3,自引:2,他引:1  
在以往海浪模型研究的基础上,根据海浪的实际形态,充分考虑各种随机参数,建立相应的海浪生成算法,其中正弦波算法是通过对大量正弦波叠加而成的海浪生成算法;统计法算法是在正弦波算法的基础上,利用快速傅立叶变换(FFTs)方法和空间频谱函数方程推导出来的海浪生成算法,它可以生成较真实的非线性波浪;最后给出两种仿真的结果。  相似文献   

6.
提出了一种新的基于空间特征的划痕检测和去除算法。该算法将对划痕的检测转化为对图像垂直投影序列的处理,降低了计算复杂度。实验结果表明,该算法能够有效地进行噪声干扰下划痕的检测和去除。  相似文献   

7.
在噪声鲁棒语音识别研究中,使用并行模型结合(parallel model combination, PMC)方法得到的模型理论上能够接近匹配噪声环境模型的性能,故成为噪声鲁棒语音识别的重要研究方向。本文首先提出了一种基于前后向差分动态参数的特征MFCC_FWD_BWD,该特征满足PMC对特征构造矩阵可逆的要求。在此基础上,提出了一种用于PMC的新模型——并行子状态隐马尔可夫模型(parallel sub-state hidden Markov model, PSSHMM),该模型每个状态包含平行关系的子状态,且子状态间存在转移关系。实验表明,PSSHMM模型在各种噪声和SNR下取得了较好的识别效果,特别是对于非平稳噪声,其鲁棒性能非常显著。  相似文献   

8.
提出一种基于主成分分析和支持向量机与线性判别分析结合算法的合成孔径雷达(synthetic aperture radar,SAR)图像目标鉴别方法. 利用主成分分析算法对SAR图像向量进行降维并提取其全局特征,对降维后的全局特征采用最小类内散度支持向量机算法进行变换,并对变换结果训练生成最佳分类器,进行分类完成目标鉴别. 实验结果表明该方法可以获得较高的分类正确率.  相似文献   

9.
为解决内河航道中具有不同运动模式的船舶轨迹识别问题,提出一种基于宽度学习系统(broad learning system, BLS)的船舶轨迹分类算法。对通航区域进行划分并制定轨迹筛选规则以构建标签矩阵。利用分段三次Hermite插值法分别从轨迹点记录时间上等时距和轨迹点空间分布上等间距两个角度,从原轨迹数据中进行特征点坐标的提取以构建轨迹特征矩阵。将标签矩阵和轨迹特征矩阵代入BLS以实现分类算法的训练与测试。以京杭运河淮安段交叉航道AIS数据为实例,进行轨迹分类实验。结果表明,基于BLS的船舶轨迹分类算法在分类精度和训练耗时上均优于基于反向传播神经网络和支持向量机的轨迹分类算法。  相似文献   

10.
《高等代数》(张禾瑞 郝炳新编第三版)第六章向量空间第二节子空间曾指出:“作为子集的两个子空间W_1与W_2的并集,一般来说不是子空间。”那么满足什么条件时,才能构成子空间呢?本文将对这个问题加以讨论。下面给出空间的并集为子空间的充要条件,供参考。 命题1 数域F上的向量空间V_f的两个子空间W_1与W_2的并集W_1∪W_2为子空间的充要条件为W_1W_2或W_2W_1。  相似文献   

11.
建立在小波分析基础上的综合脉冲星时算法,能把脉冲星的观测计时残差在小波域分解,提取出不同频率范围的分量,然后用小波方差表征脉冲星在不同频率范围的稳定度来对单脉冲星时进行加权平均,得到综合脉冲星时;脉冲星的计时残差包括了计时参考的原子钟的误差和与脉冲星本身有关的计时误差两部分,用维纳滤波的方法可以将两者进行一定区分,并消除掉估计的参考钟误差,将剩余部分作为计时残差实现对脉冲星计时的综合。实验证明,小波分析和维纳滤波方法比经典的加权算法更好,得到的综合脉冲星时的长期稳定度有了较大提高。  相似文献   

12.
在对地观测领域,高光谱图像得到了广泛应用,但存在数据量大、波段间相关性高等问题. 针对以上问题分析了已有的波段选择方法,提出了基于信息量及类间可分离性准则的遗传算法对高光谱图像进行波段选择:构造波段互相关系数矩阵进行子空间划分;利用联合熵作为组合信息量的标准,Bhattacharyya距离作为类间可分离性标准,构造遗传算法的适应度方程,改进了遗传算法中的选择算子. 最后用AVIRIS图像对提出的算法进行试验,并利用最大似然分类法对最优波段组合进行分类,总体分类精度达到94.24%,Kappa系数达到0.94.  相似文献   

13.
基于二维高阶累积量的自适应谱线增强算法的迭代步长很容易受到噪声干扰的影响,本文分析了基于二维高阶累积量的自适应谱线增强算法的特点,在此基础上提出了一种改进的基于二维高阶累积量的自适应谱线增强算法。计算机仿真结果表明,本文提出的算法对高斯白噪声和高斯色噪声都有很好的抑制作用,可以改善高斯噪声背景中小空间范围的二维信号信噪比。  相似文献   

14.
对文本的自动分类进行了研究,介绍文本分类的基本过程和文本特征选取的方法,重点介绍了一种常用的基于内容的分类算法——K-最邻近算法.利用K-最邻近算法(KNN)并结合改进的词特征权值计算方法和文本相似度的计算方法完成了文本的自动分类.通过KNN方法分类之后的结果的查准率、查全率得以明显提高.  相似文献   

15.
为提高噪声环境下语音端点检测的准确性,提出一种基于Mel倒谱距离顺序统计滤波的端点检测算法.该算法首先提取每帧语音信号的Mel频率倒谱系数,以前16帧估算背景噪声,计算每帧语音与背景噪声的倒谱距离;然后将当前帧前后相继若干帧的倒谱距离,经过一组顺序统计滤波器得到加权倒谱距离;最后根据各帧加权倒谱距离对输入语音进行分类.在TIMIT语音库上的实验结果表明,该方法在白噪声、粉噪声、汽车噪声和战斗机噪声等噪声环境下,均能得到理想的端点检测结果,且在低信噪比时依然有效.  相似文献   

16.
人类运动想象会引起脑电信号的变化。基于脑电信号的时频域分析,结合C3、C4电极脑电信号间的相互关系,依据Fisher距离进行特征抽取,运用线性分类器进行分类。从运用到3名受试者的脑电数据中,分类效果因受试者而异,从65.0%到93.1%。  相似文献   

17.
在极化合成孔径雷达(PolSAR)地物分类研究中,基于卷积神经网络的图像分割算法存在高维特征信息冗余而导致的分类边界模糊、分类精度低、计算复杂等不足,提出一种基于卷积神经网络和EM算法的轻量化图像分割网络,称为低秩重构网络(low-rank-reconstruction-net,LRR-Net),应用于全极化SAR图像的地物分类。LRR-Net从极化目标分解的思想出发,利用EM算法对特征进行低秩重构,将特征从高维空间映射到低维空间,在减少参数的同时实现更精确的分类。用高分三号全极化图像数据对模型进行训练测试并评估,结果表明模型在保证分类精度的前提下,降低了模型复杂度。  相似文献   

18.
结合中文分词的贝叶斯文本分类   总被引:1,自引:0,他引:1  
文本分类是组织大规模文档数据的基础和核心。朴素贝叶斯文本分类方法是种简单且有效的文本分类算法,但是属性间强独立性的假设在现实中并不成立,借鉴概率论中的多项式模型,结合中文分词过程,引入特征词条权重,给出了改进Bayes方法。并由实验验证和应用本方法,文本分类的效率得到了提高。  相似文献   

19.
研究了中文文本分类中的文本表示方法,提出了对中文文本表示因素的分析框架,并通过对3个数据集实验结果的分析,确定了各种文本表示因素对分类效果的影响.直接使用汉字进行划分也可以获得较好的分类效果;简单的不使用很大词库的分词和使用大词库的分词,以及复杂的分词对分类效果影响不大;仅使用01表示特征是否出现也可以获得比较好的分类效果;采用综合了合理的向量取值(如使用合适的归一化算法)可以较大幅度地提高分类准确率等.这些结论为后续的应用提供了指导原则.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号