首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
在基于内容的垃圾邮件过滤方法中,特征表达和分类算法十分重要,本文应用n-gram方法进行特征表达,以支持向量机(SVM)作为分类算法,并选取传统的人工神经网络(ANN)作为分类器作为对比,并采用不同大小的训练集和测试集来测试SVM及ANN的分类效果,观察训练集和测试集大小对于分类效果的影响。  相似文献   

2.
本文的研究目标是设计一个客户端的邮件解决方案,通过使用贝叶斯分类算法构建贝叶斯分类器,实现一个基于最小风险决策的贝叶斯分类方法的垃圾邮件处理系统.该系统主要完成收发邮件、识别垃圾邮件的基本功能,详细阐述了邮件预处理模块和邮件过滤模块的设计与实现.  相似文献   

3.
为解决不同光照条件下皮肤难以检测的问题,提出一种基于代价敏感性CS-AdaBoost算法的皮肤分类器。通过对皮肤像素提取6个基于亮度值的像素特征,并循环选取特征,使用基于CS-AdaBoost算法程序训练最佳弱分类器,通过对所有最佳弱分类器的加权线性组合得到最终的皮肤分类器。由于在算法程序中引入了代价因子θ,使分类结果偏向总错分代价较小,即提高了皮肤样本的分类正确率。使用SDD皮肤数据库评估该皮肤分类器性能,结果表明,该皮肤分类器分类正确率达到了85%,比传统皮肤分类方法提高了5%。  相似文献   

4.
垃圾邮件处理作为一种典型的文本分类应用问题,受到高维数据的困扰。为提高垃圾邮件检测的效率和准确率,提出一种基于PLS特征提取和SVM的入侵检测算法,首先对原始垃圾邮件数据利用偏最小二乘算法降低维度,再采用遗传算法寻优转换特征子集,并通过支持向量机SVM进行分类。 Matlab仿真实验表明,本算法能有效降低数据维数,提高检测的准确率。  相似文献   

5.
李冲 《教育技术导刊》2018,17(10):76-80
基于用户的协同过滤推荐算法是应用范围广且应用效果较好的推荐算法之一。传统单机模式下运行的基于用户的协同过滤推荐算法在面对海量数据时存在严重的性能瓶颈问题,很难满足实际计算需求,而基于MapReduce的并行计算框架为解决该问题提供了新思路。MapReduce是Hadoop开源框架的核心计算编程模型, MapReduce的设计目标是方便编程人员在不熟悉分布式并行编程的情况下,可将自己的程序运行在分布式系统上。根据基于用户的协同过滤推荐算法特点,提出MapReduce并行化实现方法。实验结果表明,在MapReduce并行计算框架下实现的基于用户的协同过滤推荐算法在算法性能及稳定性方面都取得了理想效果。  相似文献   

6.
SVM算法只使用已归类的数据训练分类器,而EM算法用少量已归类数据,结合大量的未归类数据来训练分类器,在减少已归类数据的同时保证了分类器的精度。本文基于EM算法的思想,根据SVM文本分类模型,提出一种新的迭代SVM文本分类算法。实验结果表明,迭代SVM算法分类精度高于传统的SVM文本分类算法,具有较好的性能。  相似文献   

7.
为提高BP神经网络算法的运行效率,利用遗传算法和并行编程思想,提出了Hadoop平台下基于MapReduce的遗传算法优化BP神经网络的并行化设计及实现方法。利用遗传算法优化BP神经网络的初始权值和阈值,提高算法分类准确率;采用MapReduce并行编程模型实现算法的并行化处理,解决BP神经网络在处理大规模样本数据集时存在的硬件开销和通信开销大的问题。选用Caltech256图像数据集,与传统的串行遗传算法优化BP神经网络算法实验对比,验证了并行化GA BP神经网络算法的优越性。  相似文献   

8.
曾果 《铜仁学院学报》2008,10(5):118-119
本文通过时K近邻算法进行研究,在其基础上提出了一种基于K近邻的邮件过滤模型.该模型通过利用已知垃圾邮件的分类结果,应用K近邻方法对未知邮件样本进行精确匹配,以排除合法邮件的误判结果,同时,结合用户对所接收邮件的处理,将系统不能正确划分的新垃圾邮件加入训练数据中,以提高类似于该邮件的后续垃圾邮件的处理效率。  相似文献   

9.
针对Android平台下恶意软件侵扰问题,提出一种基于权限—敏感API特征的加权朴素贝叶斯分类算法的检测方案。首先对Android应用程序中的配置文件进行解析,然后利用Apktool工具对APK文件进行反编译,提取出权限—敏感API特征集,并通过信息增益算法和卡方检验算法过滤冗余数据,最后利用加权朴素贝叶斯分类算法的恶意软件检测模型进行分类判断。实验结果证明,该系统能有效提高分类器的效率和恶意软件的检测率。  相似文献   

10.
中文文本分类是对中文按类别来进行分类。基于交叉覆盖算法的文本分类运用交叉覆盖算法作为分类器,能够实现对中文文本的分类。通过它和SVM(Support Vector Machine)分类器的对比实验,说明了交叉覆盖算法,相比于SVM分类器对中文文本分类效果更好。  相似文献   

11.
针对标准支持向量机训练时间过长与参数选择无指导性问题,给出一种通过粒子群优化双支持向量机模型参数的方法。与标准支持向量机不同,该方法的时间复杂度更小,特别适合不均衡的数据样本分类问题,对求解大规模的数据分类问题有很大优势。将该算法与标准的支持向量机分类器在不同的文本数据集上进行仿真实验对比,以验证算法的有效性。结果表明基于粒子群优化的双子支持向量机分类器的分类结果高于标准支持向量机分类结果。  相似文献   

12.
集成学习算法的效果取决于各个基分类器,如何构造有效的基分类器是关键。对集成学习算法中的Bagging算法进行了研究,提出了一种基于层次抽样构造SVM基分类器的方法进行P2P流分类,并通过实验验证了该方法的有效性。  相似文献   

13.
提出一种基于梯度方向直方图与AdaBoost+SVM的行人检测算法。方向梯度直方图用于描述和提取行人的外观及运动特征,并使得外观、运动特征实现相互融合。在分类器的选择上使用SVM作为AdaBoost的弱分类器对行人检测器进行分类训练,最终得到分类效果好的行人检测器,实现更好的检测性能。  相似文献   

14.
《嘉应学院学报》2016,(5):16-20
针对传统Android恶意应用检测方法在处理大规模样本时存在的训练时间长、存储空间消耗大的问题,提出一种基于增量学习SVM的Android恶意应用检测方法.该方法提取Android应用的权限申请和API函数调用特征,利用增量学习SVM理论将训练样本集随机划分为初始样本集和若干个增量样本集,利用循环迭代方法训练SVM分类器,每次新的训练仅保留上一轮训练得到的支持向量集并合并到新增样本集中,舍弃大量对分类结果不产生影响的样本以提高分类器学习效率,同时产生新的支持向量集,并最终得到一个高精度的SVM分类器.通过将增量学习SVM算法与基本SVM算法进行对比实验,结果表明,该算法可以有效降低分类器学习时间,减少样本存储的空间占用,同时随着样本规模的积累逐步提高分类精度.  相似文献   

15.
对云计算技术和数据挖掘进行研究,分析Apriori算法,针对其局限性,提出优化方案,引入云计算中MapReduce模型,实现并行化。提出一种基于MapReduce的频繁项集挖掘方法,以提高算法的运行效率,降低算法执行所需的开销。  相似文献   

16.
提出了一种基于改进的模糊C均值算法的分类器设计方法。该方法解决了分类过程中样本点分散和样本错分的问题。其基本思想是:在样本决策函数中引入隶属度函数,为了避免传统的隶属度函数归一化问题,引入放松的归一化条件,利用决策函数根据条件求偏导,得到经过训练的分类器。采用UCI标准进行数据集实验,实验结果表明,该算法具有一定的优越性。  相似文献   

17.
为了提高垃圾邮件过滤的准确率,提出了一种基于自适应本体的垃圾邮件过滤实验。该实验首先对邮件预处理,构建特征向量,采用TF-IDF方法计算权重。在预处理的基础上,将邮件特征向量输入分类器进行分类,通过Jena映射本体,并将待测邮件检测结果返回训练集,进一步自动调整本体,实现待测邮件的智能识别。理论分析和实验结果表明本实验方法的可行性和有效性,与传统的方法相比,具有更高的准确率和适应性。  相似文献   

18.
针对现有乐器分类研究中存在的使用特征量过多、分类准确率有待提高等问题,提出了一种特征量少、准确度高的乐器分类方法。基于Relief算法的主成分特征提取方法,计算出各特征量的权重,设计3层的神经网络分类器。根据所提算法和分类器,使用8项音频特征与传统的24项MFCC特征,分别对中西方9种乐器进行了分类实验,并分别使用权重最高的4、5、6项特征进行分类实验。结果表明,所提出的音频特征相比于传统MFCC特征对乐器分类的平均准确率更高,达到94.84%,且特征量更少,说明基于Relief算法的主成分特征提取方法能有效减小低相关性特征对分类准确率的影响。  相似文献   

19.
提出一种基于中心核对齐的模糊支持向量机(Centered kernel alignment-based fuzzy support vector machine, CKA-FSVM)算法并应用于中文农业文本分类.首先通过爬虫技术获取2 246个中文农业文本并进行数据预处理,然后进行文本向量化和特征处理,最后构建分类器模型,实现中文农业文本的自动分类.实验结果显示CKA-FSVM算法在中文农业文本分类上的平均准确率为91.69%,平均F1值为94.96%,比5个对比算法中的最好结果分别提升了0.04和0.24个百分点,表明该模型在中文农业文本分类领域具有较好的性能.  相似文献   

20.
鉴于甲状腺结节良恶性的判别十分依赖于有效特征的提取,提出基于DLBP与RLBP模型相结合的局部纹理特征提取算法,首先利用RLBP模型解决图像旋转不变问题,然后与DLBP模型相结合对RLBP模式特征进行选择与降维,再与纵横比、圆形度、紧致度等形状特征相结合并输入到SVM分类器中。为了进一步提高识别率,提出基于粒子群算法与网格搜索算法相结合的SVM参数优化算法。实验结果表明,该模型提取的特征用于分类识别时较上述各种模型及传统的旋转不变等价ULBP模型能获得更高的识别率,且提出的参数寻优算法相比于传统寻优算法效率更高。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号