首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
大数据产业的兴起给数据挖掘领域带来了新的生机。数据挖掘是从各行各业产生的大量的信息中挖掘出对于人们有用和有价值的知识。数据挖掘是信息时代的产物,数据挖掘是从很早就开始研究,但是真正的将数据挖掘应用到实践中是从最近几年开始兴起。本文就数据挖掘领域中经典的算法,按照分类算法和聚类算法分别给出了介绍。  相似文献   

2.
运用分类数据挖掘技术中决策树算法和神经网络算法,建立适合地面战场复杂背景下的情报数据分类算法模型,并将该算法模型运用于情报分析系统,对实现目标情报分析处理的自动化进行了有益的探讨.  相似文献   

3.
数据挖掘是一种重要的数据分析方法,旨在发现庞大的数据中隐藏着的、先前未知的并潜在有用的模式和信息,以帮助人们正确理解和认识数据,进行科学决策。关联挖掘是数据挖掘中研究最早也是最活跃的领域,其中,频繁模式挖掘是关联挖掘的核心和基础。对关联挖掘算法的研究和发展进行综述,分析挖掘算法面临的主要挑战,概括最新研究进展。  相似文献   

4.
朴素贝叶斯分类方法是数据库分类知识挖掘领域的一项基本技术,并具有广泛的应用。使用贝叶斯分类算法实现了对经典数据集Iris的分类。实践表明,朴素贝叶斯分类是一种有效的数据挖掘分类算法。  相似文献   

5.
文本分类是文本数据挖掘领域的重要技术之一。从分类算法对文本语义信息的利用程度这一角度出发,将文本分类划分为基于词形的算法和基于语义的算法两类,对每类算法进行了描述,并对当今文本数据的多样性及文本分类算法改进的可选方向进行了研究。  相似文献   

6.
随着信息技术的不断发展,应用商业智能技术进行数据挖掘与分析对商家来说也越来越重要,分类回归树和神经网络算法是数据挖掘的经典算法,其广泛运用在数据分析、预测和评估等方面。文章分别运用分类回归树和神经网络算法对零售商品采取促销方案后收入变化的数据进行分析,并建立相应的模型对促销方案效果进行预测。  相似文献   

7.
分析顾客消费需求,掌握顾客行为偏好,已成为当今企业制定正确营销策略的重要手段.在已有神经网络基础上,提出了动态神经网络结构算法,对顾客交易数据样本进行分类,在该算法中,隐藏层及单元结点不固定,而是依据样本训练结果,动态地确定神经网络的隐藏层层数及每个隐藏层的单元结点数.此外,为提高样本分类的准确性,最大化输出函数yk,采用遗传算法对样本实施优化.最后,通过案例数据对动态神经网络结构算法进行了验证,成功提取了顾客购买行为规则.  相似文献   

8.
通过逐一匹配的方式检测隐藏在海量信息数据中的入侵行为信息,入侵检测系统极易出现瓶颈效应。本文提出一种基于数据挖掘的入侵检测系统模型,将数据挖掘的思想应用于入侵检测系统的特征数据库建立和海量数据检测算法中,在保证通过入侵检测系统数据源的安全性的基础上,提高了入侵检测系统对海量信息的处理能力。  相似文献   

9.
非平衡数据分类问题是近些年机器学习和数据挖掘领域的一个研究热点。对于非平衡数据分类问题,标准的分类学习算法不能获得良好的性能,因为它们往往只关注多数类而忽略少数类。从分类学习的3个不同层面对非平衡数据分类算法进行了综述,并指出了该领域未来可能的研究方向。  相似文献   

10.
基于朴素贝叶斯分类的可疑金融交易识别研究   总被引:3,自引:0,他引:3  
张成虎  高薇 《情报杂志》2006,25(11):46-47,51
随着我国反洗钱活动中大额与可疑交易报告制度的不断完善,面对不断增长的交易报告数据,如何有效地从中检测出可疑交易是当前我国反洗钱工作中面临的核心问题之一。朴素贝叶斯分类是数据挖掘方法的一种,通过对案例数据的训练学习达到对未知类标识的样本分类。基于朴素贝叶斯分类的思想设计了适用于反洗钱中可疑交易识别的贝叶斯分类算法及模型,用数据对该算法进行了实验验证,并提出了与聚类算法相结合的综合运用设想。  相似文献   

11.
C4.5算法是数据分类的经典数据挖掘算法。整合并规范了临床确诊病例中的糖尿病并发症数据,同时进行了粗糙集约简,并运用C4.5算法实现了分类。研究表明,该方法能很好地实现决策分类,以辅助临床诊断。  相似文献   

12.
数据挖掘主要用于从原始数据资料中挖掘有用的信息,而这些数据资料的维数已经对目前大多数数据挖掘算法的效率造成了严重的阻碍,这种阻碍被称之为“维数灾难”.数据降维技术可以有效地解决这一问题.文章以数据降维方法为主线,对数据降维问题的分类进行了描述,对数据降维方法的研究现状及主要算法进行了详细的阐述,对数据降维算法最新研究进展进行了简要介绍,并指出其优缺点,最后提出了数据降维技术今后的研究方向.  相似文献   

13.
随着大数据信息技术的发展,数据在线监测和数据挖掘成为计算机信息领域研究的热点。通过对Web热点数据分割挖掘,提高信息热点追踪和Web数据分类能力。传统算法采用非结构化数据挖掘算法,无法有效对Web热点数据进行准确定位和分层挖掘。提出一种基于半结构化分割的Web热点数据挖掘算法。采用半结构化数据进行特征分割,基于优秀基因位进行差分进化,使寻优曲线不断趋于平缓,在多个节点上并行的运行比较脚本,采用半结构化分割,使得Web热点特征挖掘实现自适应寻优,得到Web热点数据的分配因子,提高了挖掘性能。仿真结果表明,该算法获得了良好的效率和精度,提高了Web热点数据挖掘的自适应寻优能力。  相似文献   

14.
数据挖掘技术是目前信息技术研究的热门问题,被广泛的应用于各个行业,但在教育领域的应用相对较少。本文对数据挖掘技术中的关联规则进行了介绍,实现了Apriori算法,并应用该算法对学生成绩进行分析,挖掘学生成绩数据中的隐藏信息,找出了各个成绩为优秀的学科之间的关联性,得出了语文、数学、英语及各文理科课程的相互影响程度,为教育管理部门提供决策支持。  相似文献   

15.
决策树算法是数据挖掘技术中常用的方法,在分类和预测方面有着广泛的应用。本文简要地介绍了决策树ID3算法的基本思想,通过数据实例说明了构造决策树的实现过程,实现了对学生成绩的预测。  相似文献   

16.
在当前的复杂数据挖掘方法中,多是基于关联规则进行关联挖掘,一旦数据之间的关联性被大量的冗余关联打破,形成数据的无序性,就会出现挖掘耗时,挖掘错误较多的问题.为了解决这一问题,本文提出一种基于信誉兴趣区间划分的数据优化查询算法.在海量的数据中,针对错综复杂的数据关系,通过信誉兴趣函数对数据进行较为清晰地划分.尤其在关联规则较为混乱的情况下,这种方法能够得到更为准确的数据分类区间.实验结果表明,这种数据挖掘方法针对大型数据库中的海量数据挖掘效果更佳,且挖掘算法速度更快,效率更高.  相似文献   

17.
目的:研究数据挖掘算法对乳腺肿瘤超声图像特征的属性选择优化,探讨适用于乳腺肿瘤良恶性分类的数据挖掘分类算法。方法:对乳腺肿瘤超声图像进行预处理,获取病灶区形状,提取病灶区图像形态、形状、纹理特征。应用数据挖掘算法进行图像特征属性选择,形成优化的乳腺肿瘤超声图像混合特征。应用分类算法评价其分类性能,筛选适用于乳腺肿瘤良恶性判定的数据挖掘分类算法。结果:利用混合特征结合随机森林算法对图像进行分类,其ROC曲线下面积AUC为0.7914,平均查准率达到了79%。结论:属性选择优化后的混合特征对乳腺肿瘤良恶性分类性能高于其他特征。在混合特征条件下,随机森林分类算法性能与Bayes网络相近,分类准确率高且性能稳定,更适于乳腺肿瘤良恶性分类评价。  相似文献   

18.
针对级联数据库中可逆隐藏数据定位不准,访问恢复困难的问题,提出一种基于非对称补偿粒子滤波的可逆隐藏数据访问算法,实现对数据库中可逆隐藏数据准确访问。算法使用非对称粒子滤波对数据库中可逆隐藏数据的目标位置和访问信道衰减参数进行同时估计,提高可逆隐藏数据定位精度。设计非对称补偿滤波器,抑制数据访问中相干数据干扰,采用迭代方式对隐藏数据访问进程进行更新。最后采用取对数能量求倒谱的方法对数据进行恢复处理,实现对可逆隐藏数据的精准定位访问。仿真实验表明,采用该算法对大型级联数据库进行访问,能准确定位可逆隐藏数据,抗干扰能力强,无损可逆性好,数据库访问识别率和鲁棒性均有明显提高。  相似文献   

19.
为检查入侵系统的隐藏木马数据,复原入侵痕迹,保证系统数据安全,根据自组织神经算法,构建了幅值控制算法。在分析入侵流程以及入侵隐藏的基础上,通过设定幅值范围,控制模式向量的偏移值改进了调整模块,结合识别层与比较层的配合进行算法学习。新算法可有效避免模式中心过渡偏移使结果无法匹配以及类边缘模糊导致数据挖掘结果过于庞杂的问题。最后通过挖掘目标入侵数据,并对比挖掘结果,验证算法的优越性与可行性。  相似文献   

20.
决策树算法是数据挖掘领域的核心分类算法之一,ID3算法则是最为经典的决策树算法。本文以ID3数据挖掘算法在债务管理中的应用为例,验证了算法的性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号