首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
随机森林是一种优秀的分类算法,然而随机森林算法不能有效的判断冗余属性,因此影响了在含有冗余属性的数据集上的分类效果。针对这一问题,本文提出了一种基于局部线性嵌入的随机森林算法。该算法利用局部线性嵌入算法对冗余属性数据集进行降维,然后利用随机森林算法进行分类学习。在UCI标准数据集上的仿真实验说明,本文算法是一种优秀的含冗余属性数据集分类算法。  相似文献   

2.
随机森林算法在数据挖掘领域中得到了广泛的应用,该算法通过构建多个不同的决策树可以获得更高的分类结果。但是,随着数据规模的增大,人们开始接触到各大规模的数据以及更高维度的数据属性。传统的随机森林构建算法不能有效、快速地处理海量高维数据,严重影响了数据的分类效率,从而影响预测效率。本文针对高维、海量数据下随机森林构建算法,改进并提高了该算法的效率,提出了基于云计算平台的随机森林构建算法。该算法可以快速的完成数据分类预测,并通过实验结果进一步展示了该算法的效率以及可扩展性。  相似文献   

3.
针对核电厂机组能力因子分类研究缺少相对简单有效的方法,基于第一至第八次《中华人民共和国核安全公约国家报告》中世界核电营运者协会(WANO)性能指标的数据,提出一种随机森林模型(random forest,RF)的机组能力因子分类方法,通过估算随机森林模型决策树的棵树、内部节点再划分所需要的最小样本数等,构建最优的随机森林分类模型,成功实现对能力因子的快速和精细分类,为第九次国家报告中定性掌握我国核电机组发电状况及行业内机组所处状况提供依据;同时,选用解决二分类的Logistic回归作对比试验,试验结果表明RF分类算法的总体精度达到77.27%,Kappa系数为0.705 3,达到高度一致性检验标准区间,明显高于Logistic回归的51.14%和0.110 1,RF表现出分类效果好、准确率高和性能稳定等优点,能够有效提高机组能力因子分类的准确度。  相似文献   

4.
将随机森林融合支持向量机(RF-SVM)模型引入个人信用评估问题中,利用随机森林的特征选择算法,对实验样本进行属性特征选择,将得到的结果作为输入变量构建模型,以获得更高的预测精度。通过对大量SVM分类模型研究,发现传统SVM模型中无法有效筛选预测指标。通过对实验样本实证研究,并验证该模型的预测结果可信度,将其与单独的全变量SVM模型结果比对,结果证明,该方法能获得较好的预测效果。  相似文献   

5.
以Sentinel-1/2哨兵卫星获取的雷达和多光谱遥感影像为数据源,提取多时相光谱反射和微波后向散射特征变量,基于面向对象的随机森林算法对吉林省扶余市水稻、玉米和大豆分类,并与支持向量机算法比较,综合评估基于多源遥感数据的面向对象随机森林算法对大范围农作物自动识别的适用性。结果表明:利用多时相多源遥感数据能够有效提高作物分类精度。面向对象随机森林算法的分类总体精度为87.32%,高于支持向量机算法9.82%。利用面向对象随机森林算法结合多时相主被动遥感特征变量能够准确地自动识别大范围农作物,可为作物种植面积调查与产量估值提供重要的支撑。  相似文献   

6.
犯罪预测一直是公安部门亟待解决的突出问题。基于随机森林这种模型组合分类器,结合机器学习技术在犯罪预测中的应用现状,提出了一种用于预测犯罪的新的分类方法,并通过模拟实验来展示这种分类方法比一般的随机森林分类会有更高的可信度。创新之处在于提出的这种随机森林分类器的每一棵树都是退化的决策树,并且根据在线学习的结果在下一轮的分类中选择区分度更高的决策树。最终给出一个应用于犯罪预测的较为成功的分类器的思路和模式,得出准确有效的预测结论。  相似文献   

7.
王卫  李晓娜  闫帅 《现代情报》2018,38(11):109
作者合著关系的预测对于提高科研合作效率和有效的科研管理具有重要的意义。本文以中国知网中图书情报领域核心期刊作为信息来源,获取15年(2001-2015)的文献信息。通过计算指标方差和指标性质确定对合著关系预测的指标体系,同时对比基于单指标的无监督方法和基于分类算法的监督式机器学习方法(逻辑回归、支持向量机和随机森林)的预测效果,本文最终确定基于随机森林和指标体系所构造的合著关系预测模型。通过实例应用证明该模型具有较好的准确性和稳定性。  相似文献   

8.
本文提出了一种基于训练集划分的随机森林算法。该算法首先将多数类划分为多个不相交子集。然后将每个子集与少数类合并,进行决策树的训练。最后根据平均加权策略构建随机森林,并获取最终的分类规则。本文所提方法避免了原始样本信息的损失,而且保持了子分类器的样本平衡。在人工生成数据集上的仿真实验表明本文方法非常有效。  相似文献   

9.
《软科学》2018,(5):139-144
在线上供应链金融融资模式特点的基础上,建立了相应的信用风险评价指标体系,同时,分别基于SMOTE-RF模型、C-SMOTE模型与Logistic模型进行了分析,结论认为,C-SMOTE-RF模型在线上供应链金融信用风险评估上更加准确可靠。基于C-SMOTE算法的随机森林模型在帮助商业银行管理线上供应链金融信用风险、降低信用损失上效果更为显著。  相似文献   

10.
王仕俊  平常  薛国斌 《科技通报》2019,35(11):135-138,142
针对目前在局部放电模式识别领域中常用的分类器算法的缺陷,本文研究随机森林(random forest,RF)算法在局部电放模式识别领域的应用。首先对局部放电试验数据提取统计特征量,构建放电的学习样本。利用十折法对算法分类性能进行评判,并比较常见分类算法BP神经网络、支持向量机(support vector machine,SVM))、KNN、分类回归树算法(classification and regression tree,CART)以及RF算法的识别准确率。结果表明:利用RF算法构建放电模式分类器的识别准确率最高。此外,利用组成RF的基分类算法CART可分析不同放电模式间的主要区别。  相似文献   

11.
提出了一种人脸关键点检测方法,该方法用了少量的正面图像,不用归一化人脸图像,而传统的人脸关键点检测方法需要对图像进行严格预处理。随机森林是一种分类器融合算法,可以很好地解决多类分类问题,虽然LBP特征简单,但其可以包含大量的纹理信息。利用改进的LBP特征与随机森林相结合,构成一种对人脸关键点检测的方法。通过高斯平滑图像的LBP特征的提取,对每个点生成特征,计算出有用的特征作为正例,并且与反例集合变为训练集。通过随机森林分类器进行分类,误差率较低,仅在10%左右。  相似文献   

12.
图像分割是X射线扫描图像检测系统中的关键部分。本文是在活动轮廓模型的图割(Graph Cuts Based Active Contours)算法基础上,利用测地线模型去实现活动轮廓模型,再根据图割去计算测地线,最后通过最大流/最小割原理进行求解实现图像分割。在分割处理后的图像上,利用随机森林(Random Forest)圆形度这一属性进行焊点的识别。实验结果表明基于训练圆形度的随机森林算法对焊点的识别能力优于直接通过圆形的阈值来识别焊点的能力。  相似文献   

13.
目前井筒完整性研究主要围绕当前态的风险量化与评估,尚未形成对未来井筒完整性失效的预判技术。为了研究井筒完整性失效预判方法,基于目标油气田中生产井的7项关键属性形成大数据矩阵,随机抽取和建立数据子集,利用随机森林机器学习算法挖掘各属性与井筒完整性之间的隐含联系,研发了井筒完整性预判方法,分别针对3项离散型和4项连续型属性,详细阐述了随机森林决策树的产生步骤、分裂原理和核心算法。通过引入随机参数加强算法的鲁棒性;通过引入生产时间属性,实现了预判未来发生井筒完整性失效时间的目的,最后结合实例分析,验证了基于随机森林的井筒完整失效预判方法的可行性,具备实践指导意义。  相似文献   

14.
王思培  韩涛 《情报科学》2020,38(5):120-125
【目的/意义】为了支持高价值专利培育工作开展,面向潜在高价值专利预测的需求,提出基于随机森林算法的潜在高价值专利预测方法。【方法/过程】梳理现有研究,选择用于潜在高价值专利预测的指标,构建基于随机森林算法的潜在高价值专利预测模型。使用“语音信号识别”领域的19647条专利进行实证分析,模型预测准确率达96.01%。【结果/结论】目前适于从海量早期申请中发掘潜在高价值专利的方法研究较少,本方法能够在专利申请早期发挥作用,同时具有预测准确率高、处理数据量大、模型可解释性好的优点。  相似文献   

15.
武华华  匡海波  张鹏飞 《科研管理》2018,39(10):148-158
本文全面考虑BDI指数不同类型的影响因素,将影响因素划分为供给方面、需求方面以及宏观经济三种类型,采用基于VMD分解、小波分析与随机森林回归算法构建的VMD-WA-RF模型,综合分析各影响因素与BDI指数的关系,增强了BDI指数影响因素分析的数学理论。进一步的研究发现:一是,借助VMD-WA-RF模型能够得出BDI指数影响因素的重要性排名,有助于有针对性的调节航运市场;二是,能够得出最重要的五个影响因素分别对BDI指数的影响程度,科学地找出能够迅速调节当前航运市场最有效的方案;三是,通过随机森林回归模型,对BDI指数进行预测,表明本模型预测的精确度较高。  相似文献   

16.
对隐性知识外显案例实施有效适配,于知识应用乃至创新、实现乃至增值知识资源的价值,具有重要意义。本文深入研究了隐性知识外显案例适配机理。首先,采用毕达哥拉斯模糊集对知识属性值进行处理,建立知识表达系统;接着,运用K-Means算法对FCM聚类算法进行改进,压缩匹配空间、提升案例匹配效率;而后,基于PFS相关系数求解知识供需间的视图相似度,从而获得适配案例集。在此基础上,构建随机森林适配模型,并采用粒子群算法对其优化,以确保适配效果。与传统算法的对比实验验证了本文算法的比较优势。  相似文献   

17.
为了用尽可能小的蒙特卡罗模拟样本来反映模型模拟结果中的不确定性,把拉丁超几何体采样引入地统计随机模拟的LU分解算法.首先把拉丁超几何体采样与普通随机采样在LU分解算法中的表现进行比较,然后把基于拉丁超几何体采样的LU分解法应用于空间直观森林景观模型LANDIS的模拟.结果表明,与普通随机采样相比,拉丁超几何体采样能捕获更多的不确定性,特别是在蒙特卡罗模拟次数较少时.LANDIS模型的模拟结果表明,由地统计学随机模拟所引入的不确定性在象元尺度上随模拟时间增加而增加,但是在景观尺度上并没有受很大影响.这表明由地统计学随机模拟所参数化的LANDIS模型可用于大时空尺度森林景观变化的预测  相似文献   

18.
农作物分类与识别是开展农作物的长势、产量、灾害等相关信息监测的基础,对确保粮食安全、发展社会经济、制定农业政策以及保护生态功能等有重要作用.本文以"原阳大米"之乡河南省原阳县为研究区,基于谷歌地球引擎(Google Earth Engine)云平台,利用随机森林(Random Forest)机器学习算法,通过地面实测数...  相似文献   

19.
架空输电线路铁塔结构是我国主要的输电方式,一旦发生损伤破坏将造成严重的经济损失。本文提出了一种基于随机森林的数据融合架空输电线路损伤识别方法。首先,采用多个传感器获取铁塔在不同损伤位置和程度上的振动加速度信号,并运用小波包对其进行多层分解;然后,将提取出来的各频带能量值构成特征向量输入到相应的随机森林进行训练和测试;最后,将多个随机森林分类器的次级决策进行数据融合,做出最终铁塔损失情况决策。应用该方法对500kV高压输电铁塔模型进行试验,并与单一分类器相比较。通过对实验数据的分析表明,该方法对铁塔损伤的识别效果优于单一RF分类器,可以有效地改善单一分类器的识别能力。同时也表明该方法具有较好的分类效果和容错能力。  相似文献   

20.
针对不平衡数据集少类样本分类精度低的现象,本文提出了一种新的不平衡数据扩充采样算法。改进算法通过距离度量,在少类样本中心与其近邻间进行随机线性插值,使数据平衡。改进算法与SMOTE算法、C_SMOTE算法分别对5个不平衡数据集进行扩充分类对比实验,基于AUC、OOB、F值与G值评价指标及成对样本T检验,证明改进算法能有效缓解类不平衡,并具有更优异的不平衡数据处理性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号