首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 150 毫秒
1.
传统的基于规则的分类算法多是采用顺序覆盖技术训练分类规则,这使得训练得到的模型覆盖大量的非目标类实例,分类时效果差.基于规则的两阶段分类算法,能够很好的去除模型覆盖的非目标类实例,分类时能取得比较好的结果.EP在分类大型数据库时能够提高分类效率,eEP(Essential Emerging Patterns)是一种特殊的EP,较EP能够减少分类噪音.本文中我们构造一个新颖的分类算法,基于eEP的两阶段分类方法(即EEPCTP),并使用UCI机器学习库中的10个数据集做实验,实验表明EEPCTP分类法取得了与一些经典的分类算法可比的效率和准确性.  相似文献   

2.
SVM算法只使用已归类的数据训练分类器,而EM算法用少量已归类数据,结合大量的未归类数据来训练分类器,在减少已归类数据的同时保证了分类器的精度。本文基于EM算法的思想,根据SVM文本分类模型,提出一种新的迭代SVM文本分类算法。实验结果表明,迭代SVM算法分类精度高于传统的SVM文本分类算法,具有较好的性能。  相似文献   

3.
为减少不均衡数据对支持向量机分类性能的影响,提出一种基于二次支持向量机的欠取样分类算法,该算法依据样本的分类超平面贡献大小对多数类样本进行欠取样.并对少数类样本进行过取样,重构训练数据集。该算法能够删除样本中的噪声数据。用控制参数控制删除样本的规模,实验表明,该算法能够提高支持向量机在不均衡数据集下的分类性能。  相似文献   

4.
研究了一种基于神经网络的心电图分类方法,该方法利用前向多层神经网络的反向传播算法(Back Propagation),即BP算法,采用MATLAB软件建立用于三分类的BP神经网络,并利用大量的心电图数据训练神经网络,使神经网络对未训练过的心电图有较好的分类能力。实验结果表明,用这种方法用于心电图的三分类取得较好的效果。  相似文献   

5.
文中提出了一种改进的k-prototypes算法,该算法可以解决具有数值和分类混合类型数据的聚类问题,将它应用于对某高校网站的Web服务器日志进行数据分析,发现有意义的信息,建立规则库,并验证了算法的有效性。  相似文献   

6.
对于已经分类的数据和大量未分类数据,在运算过程中,采用一种新的半监督聚类算法为支持向量机提供新的训练数据.随后,利用支持向量机判别出所有数据的类别属性,并选取最可靠的点加入已分类集合.为了验证算法的效率,收集了67张黄瓜叶片色调的数字信息,并对具有6个已分类数据与61个未分类数据的数据集进行半监督聚类分析,以判断这些叶片的健康程度.结果表明,该聚类算法优于其他算法.  相似文献   

7.
针对序列最小优化(SMO)算法对大规模数据集训练速度慢、分类精度不够高的问题,提出了一种改进方法。该方法对SMO算法的核函数进行改进,通过增大二次项系数的绝对值提高分类正确率,并结合网格搜索法优化基于核函数改进的SMO算法的有关参数。实验结果表明,该算法显著提高了分类的正确性,缩短了算法的建模时间。  相似文献   

8.
通过学习训练数据集来构造分类树的策略可能无法达到最好的泛化性能。随机噪声和某些决策仅基于少量训练数据的情况都会导致决策树的分类精度下降,并且过度拟合训练数据集。避免过度拟合主要是通过对树的剪枝来实现,包括预剪枝和后剪枝。后剪枝方法有很多种,主要从计算复杂性、误差估计和算法理论基础角度分析其中的REP、MEP和规则后剪枝算法。  相似文献   

9.
构造性学习(CML)算法训练分类器对有些样本会有“拒认状态”,构造性学习算法中对这一状况的处理使用就近原则,然而,这种方法无法体现数据之间的联系.为了能更好地体现数据间的联系,提出了人脑分类机理的构造性学习方法(HB-CML).在测试阶段,把测试样本、训练样本都考虑进来,利用人脑对数据的自动分类机理,对“拒认状态”样本进行分类标记.同时,选取UCI数据集进行实验.结果表明:与CML算法相比,该方法的分类更为有效.  相似文献   

10.
提出了一个基于统计分析的数据分类算法.通过使用从训练集中提取的信息,对支持集选择问题进行建模,以得到具有良好分离能力的小型支持集.采用混合整数规划模型计算最优的权重值和分类阈值,通过将样式加权和与分类阈值进行比较来对数据进行分类.并使用真实数据集对本算法进行性能评估.实验结果表明:本算法不仅能提高分类的精度,还能有效减少分类所需的计算时间.  相似文献   

11.
增量式更新算法能充分利用已挖掘出的知识来提高挖掘效率,是数据挖掘高效算法研究中一个主要方向.本文首先分析了经典的关联规则增量式更新算法FUP(Fast Updating algorithm)算法的不足,提出了一种改进的关联规则增量式更新算法IIUA(Improved Incremental Updating Algorithm),极大地降低了存储空间和挖掘时间需求,从而提高了整个关联规则挖掘的效率.  相似文献   

12.
传统机器学习均假定测试域和训练域处于同一概率分布,但现实中往往因各种原因引起所采集到的样本数据可能存在扰动或噪音情况,导致概率密度估计不一定准确。为有效解决这一问题,提出一种新的领域自适应数据集概率密度估计(A-RSDE)算法。该算法可充分学习源域(训练域)概率密度分布知识,使目标域(测试域)概率密度估计更接近真实概率密度分布。实验证明,该算法具有有效性,且实现了数据浓缩的目的。  相似文献   

13.
算法是高中课程新增加的内容,是数学与信息技术的内容之一.高中数学教师或信息技术教师对于“算法教学的价值、如何理解和把握算法”的思考与探索是高中算法教学水平的如实写照.算法是计算科学的基础,也是开发人脑潜能的工具.从培养“种子”教师、学科协作教学、解剖实例体验算法特点和“简化”的教学策略等方面着手探索提高算法教学的效率.  相似文献   

14.
针对大规模数据集上的模式分类任务,提出了一种基于Parzen窗核密度估计的模式分类隐私保护算法。该算法首先利用Parzen窗算法对原始大规模训练集服从的概率密度进行估计,然后根据估计的概率密度函数构造la个替换训练样本,其中l为原始样本的数目,a通过10折交叉验证方式确定。最后发布替换训练样本进行模式分类,以实现原始数据上的隐私保护。在Adult数据集上的仿真实验充分验证了该算法的有效性。  相似文献   

15.
快速转运仓库设计是现代物流网络设计中一个重要的环节,其设计的好坏直接影响到整个物流网络的效率.针对有代表性的3种快速转运仓库设计方案,运用遗传算法进行比较,并对其结果进行分析.  相似文献   

16.
提出了一种基于BP算法的石化设备可靠性建模与评价新方法,利用BP算法对复杂非线性系统的拟合能力,通过网络训练自适应地调整单一预测模型的权重,并应用MATLAB神经网络工具箱实现了基于BP算法的石化设备可靠性评价软件。结合兰州石化设备管理与预警系统实时监控数据,将该方法应用于计算某石化设备通道的故障概率和评价设备的整体可靠性,通过评价各种训练方法的学习效率,评价结果对比表明该方法具有平均计算时间短和收敛快的优点,在设备故障和可靠性评价中具有广泛的应用前景。  相似文献   

17.
为了提高从web中挖掘数据记录的精确性和完整性,提出了同构页与目录页的概念及3个算法.如果一组网页结构相同,只是主信息不同,该网页称为同构页.一个包含有多个指向同构页连接的网页称为目录页.算法1用于发现目录页,它首先将连接排序,并对同一目录的链接记数,如果记数大于某一给定阀值,则对其链接子页进行相似比较并得到结果.同时给出了一个网页相似度判断的函数.算法2采用了噪声信息过滤方法从同构页中挖掘主信息并得到数据记录,该算法是基于在2个同构页中噪声信息相同而只有主信息不同.算法3通过采用Spider技术可以实现从整个网站中自动挖掘数据记录.实验表明所提算法比已有算法可挖掘更完整的数据记录.从同构页中挖掘数据记录是一种有效的方法.  相似文献   

18.
少儿篮球训练是整个篮球训练的基础和关键。根据有关资料和对四川省隆昌县少儿篮球队的调查发现,在训练中,易忽视思想教育、忽视基本功训练、忽视心理训练、忽视慢性微细损伤等问题。  相似文献   

19.
本文提出了一种基于连接的事务数据的多隶属聚类算法MCBL。并给出了该算法的一个实现实例。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号