首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
针对唇语识别过程中唇部特征提取和时序关系存在的问题,提出一种卷积神经网络(CNN)和双向长短时记忆网络(Bi-LSTM)相结合的深度学习模型。利用CNN学习唇部特征,并将学习到的唇部特征送入Bi-LSTM进行时序编码,通过Softmax进行分类。建立NUMBER DATASET和PHRACE DATASET两个大型汉语数据集以解决汉语唇语数据缺失问题。将该模型与传统的唇语识别方法在两个数据集上进行实验对比,发现在NUMBER DATASET上识别准确率为81.3%,比传统方法提高了8.1%,在PHRACE DATASET上识别准确率为83.5%,比传统方法提高了9%。实验结果表明该模型能有效提高唇语识别的准确率。  相似文献   

2.
针对卷积神经网络(Convolutional Neural Network,CNN)在人脸图像识别中面对训练规模较大的图像集数据时收敛速度慢、效率低以及在复杂情况下识别率不高的问题,提出一种优化改进的CNN图像识别方法。该方法首先利用不含标签的图像训练一个稀疏自动编码器,得到符合数据集特性、有较好初始值的滤波器集合,然后对CNN的卷积核初始化赋值,从而大大提高其整体上使用BP算法进行训练的收敛速度,其次使用多类别SVM分类器(Multiclass Support Vector Machine)代替传统的Softmax分类器,对目标图像进行识别,在ORL和FERET等人脸图像库上的实验结果显示,所提算法与采用传统PCA+SVM算法及传统CNN算法相比,在人脸图像识别中有更好的识别效果。  相似文献   

3.
交通标志识别系统是智能交通系统与先进辅助驾驶系统的重要组成部分,由于道路交通较为复杂,提高交通检测与识别算法的准确率和实时性是走向实际应用进程中需要解决的关键问题。文章提出一种基于参数优化的卷积神经网络方法,在对选用的数据集进行预处理操作基础上,适当调整CNN的规模、结构,使用网格法对相关参数进行协同优化,再使用改进的CNN模型在CTSDB数据集上进行训练和验证。结果表明:优化后的模型性能和稳健性均显著提高,且能够有效地完成交通标志的识别、分类任务。  相似文献   

4.
随着人工智能的发展,计算机对于输入的手写字符识别需求越来越大,采用改进的卷积神经网络对手写字符进行识别分类。用VGGNet16模型构造卷积神经网络模型,每一层都加上批标准化,通过平均值池化对卷积层进行下采样,利用PRELU激活函数代替ReLU激活函数,最后通过Softmax分类器对手写字符图像进行分类。在MNIST手写数字数据集和EMNIST-bymerge手写字母及数字数据集下进行实验,改进的卷积神经网络模型在MNIST数据集中识别准确率提升到99.65%,在EMNIST数据集中识别准确率为90.37%。因此,改进模型识别准确率较高,适用于手写字符识别。  相似文献   

5.
为了弥补经典LeNet-5卷积神经网络模型在交通标志识别中易发生过拟合的不足,克服其识别准确率与训练效率较低的缺点,采用GTSRB德国交通标志数据集,并对数据集进行扩充,使训练集数量达到6 312 649张,同时对经典LeNet-5卷积神经网络模型在激活函数、池化策略、随机丢弃及网络结构等方面进行改进,使用基于交叉熵的梯度下降算法对模型的误差反向传播过程进行优化。实验结果表明,改进后的模型较改进前在识别准确率与训练效率上都有所提高,识别准确率最高可达97.04%。因此,基于交叉熵的卷积神经网络不仅能够提高模型的交通标志识别准确率,有效防止过拟合,还能够提升网络训练效率。  相似文献   

6.
为解决裂缝识别算法在复杂环境下性能不佳的问题,提出了一种基于单激发多框检测器(SSD)算法的改进方法.该方法通过调整原始SSD算法中不同分辨率先验框数量的组合,实现对存在噪声的裂缝图像的高精度裂缝识别.在真实场景和实验室中采集足够数量的裂缝图像并进行预处理,利用椒盐算法对裂缝数据集添加噪声模拟复杂环境中的裂缝图像.在识别裂缝数据集时,对改进方法与原始SSD算法进行对比分析.结果表明,原始SSD算法和改进方法识别裂缝的准确性均随噪声水平的增加而降低.在高密度下添加20%等级的椒盐噪声时,原始SSD算法识别裂缝的准确率仅为31.7%,而改进方法的准确率则高达93.0%.因此,改进方法具有较强的抗噪能力,可用于复杂环境下的裂缝识别.  相似文献   

7.
为提高图像增强算法的图像识别有效性,提出了基于图像增强的低光照图像识别算法。首先,采用直方图均衡化的图像增强算法对开源低光照图像数据集(ExDark)进行增强处理;然后,设计卷积神经网络进行图像识别训练,通过多重卷积—池化操作,实现图像特征提取;最后,将识别结果与其他增强方法结果进行对比实验。结果表明,与其他传统方法相比,在低光照图像的处理中采用直方图均衡化的图像增强法可获得更高的图像信息熵与图像对比度,图像识别准确率提升了14.4%,对低光照条件下的图像识别具有参考价值。  相似文献   

8.
目的:针对现有玉米病害种类繁多、识别方法耗时耗力等问题,对传统卷积神经网络结构进行改进和优化,提出Corn_Modle新型玉米病害自主识别模型。方法:构建含有6种玉米病害种类的数据集,并对其进行数据增强和预处理;将新建模型在训练集上进行训练,利用测试集对其进行试验验证。结果:Corn_Modle模型的准确率为96.85%,参与对比的AlexNet、LeNet-5、ResNet50、MobileNet等4种经典模型的准确率分别为93.98%、77.06%、63.44%和87.25%,在准确率、精准度、召回率等评价指标上优于对比模型。结论:新构建的Corn_Modle模型在准确率、鲁棒性和稳定性方面比传统的经典模型表现更好,可为玉米等农作物病害识别技术的发展提供参考。  相似文献   

9.
基于迁移学习的家猪图像识别研究   总被引:1,自引:0,他引:1  
为实现家猪图像识别并提高识别准确率,提出一种基于迁移学习的家猪图像识别方法。首先对现有数据集进行数据增强,然后迁移 VGG16 模型并对其进行微调,从而更好地提取图像特征并缩短网络训练时间。采用自归一化神经网络解决了梯度消失和梯度爆炸问题,在网络构造时使用全局平均池化代替全连接层,以达到降低模型过拟合的效果。实验对比结果表明,该方法分类效果较好,准确率达到了 84%,召回率和 F1 值分别提升至 0.8、0.82,各项指标相比基础模型均有所提升。  相似文献   

10.
将卷积神经网络(CNN)引入到海洋平台损伤识别应用中,开发了基于一维CNN的导管架式海洋平台损伤识别实验系统。构建一维CNN结构损伤识别模型,基于振动台规则波激励获取导管架式海洋平台模型的应变响应实测数据,将实测数据分为训练集和测试集,进行CNN网络的训练和测试。在此过程中,考虑了完好工况、单损伤、多损伤等不同损伤位置共7个模拟工况。实验结果表明,一维CNN可以有效地识别海洋平台结构损伤位置,开发的实验系统可进一步扩展其功能。  相似文献   

11.
针对传统无人机遥感图像信息提取与分类算法准确率低、稳定性差、无法有效应对大规模复杂遥感图像数据集等问题,提出一种基于RF-SVM的遥感图像处理算法。RF-SVM算法将RF数据集分类性能较强的优势与经典SVM算法数据降维能力相融合,引入随机变量和示性函数扩大样本集的边界,提升对复杂大规模数据集的处理能力,有效控制泛化误差。在对无人机遥感图像的预处理过程中,借助Brovey变换完成对光谱和高分辨率遥感图像的像素级融合,引入核函数并根据获取到的遥感图像特征和后验概率值,实现对遥感图像内部标的物的准确分类。实验结果显示,在RF-SVM算法下,无人机遥感图像信息提取准确率分类平均准确率达到99.81%,且在RF-SVM算法下的样本点感受性曲线稳定性更好。  相似文献   

12.
传统基于统计的命名实体识别方法存在需要大量人工标注的缺陷,导致识别准确率较低。为了提升识别效果,提出一种基于条件随机场的半监督学习方法(S-CRF)对命名实体进行识别。该方法将实体识别看作序列标注问题,对少量数据进行人工标注并构建实体集,通过K-means聚类算法选取有代表性的未标注数据文本进行自动标注,采用条件随机场对语料进行训练测试。选取中文应急预案文档进行实验,该方法在各个标签上的识别效果分别达到93.52%、93.04%、95.81%。实验结果表明,该方法优于传统规则方法,能有效提高应急预案命名实体的识别效果。  相似文献   

13.
在手写数字识别数据集(MNIST)情景下,为了提高卷积神经网络的识别正确率,提出了一种改进的基于卷积神经网络(CNN)的多尺度特征识别算法.首先,利用卷积操作和池化操作提取图像中的全局特征及局部特征,通过二次卷积与特征融合获得数字图像的多尺度特征.然后,将多尺度特征送入全连接网络和Soft Max分类器,实现手写数字图像识别.最后,通过对不同网络结构的CNN算法进行评估表明,本文提出的算法可以有效提高网络精度,具有较好的泛化能力.  相似文献   

14.
乳制品纸包装上的生产批号在喷码过程中由于各种原因部分字符出现粘连或缺失,影响字符的自动化识别。针对这一问题,提出了一种基于改进的CNN喷码式不规则字符识别与提取方法。首先,利用yolov3算法对生产日期区域进行提取;其次,对图像进行预处理;再次,通过一种基于字宽的分割算法结合投影法,利用相邻字符间的像素差异实现对粘连字符的分割;最后,对分割后的单个字符利用改进的CNN进行多标签分类训练得到模型。实验结果表明,改进后的模型对粘连字符和半或残缺字符的识别准确率分别为97.89%和96.71%,相较于模板匹配法、传统的LeNet-5模型、fast R-CNN+NMS模型和yolov3+K-means算法都有所提高。基于该方法设计的字符识别系统,提高了生产日期的在线识别准确率。  相似文献   

15.
已有的煤矸石识别方法具有一定效果,但无法满足实际需求。为了寻找新的煤矸石识别方法,提出了基于深度学习的煤矸石图像识别方法。采用Inception模型,并通过迁移学习共享已训练模型卷积层权值和偏差。从煤矸石图像库中随机抽取煤矸石图像作为训练集和测试集,最后将该方法与传统图像识别方法进行比对。实验结果表明,该模型可以有效识别煤矸石,准确率为93.5%,有效提高了煤矸识石别准确率。  相似文献   

16.
针对面部表情识别算法存在模型结构复杂、训练参数过多等问题,在对卷积神经网络各层分析的基础上,将迁移学习算法融入到面部表情识别模型中,从而对面部表情进行识别和分类.该文提出的算法首先通过数据增强的方法扩充面部表情图片的数量,然后将VGG16模型在ImageNet图像数据集上训练得到的权重参数,通过参数微调的方法,传递到面部表情识别模型中.最后采用全局平均池化层代替传统的全连接层,对表情图片通道信息进行求和运算实现降维,减少模型的网络参数.实验结果表明:提出的模型在KDEF数据集中取得了优异的识别效果,平均测试准确率达到96.23%.  相似文献   

17.
三维模型相似性分析是计算机视觉中的重点问题,如何构建其形状特征和对比函数是难点。随着深度学习出现,通过神经网络自动提取模型特征成为研究热点。构建了双层CNN网络,首先利用热核特征函数分别构建带有颜色的刚性和非刚性训练集与测试集,其次将数据集通过双层CNN网络进行模型训练,第一层实现类别初步判定,第二层实现同一模型刚性与非刚性形变区分。为了提高分类准确度,对初步分类错误的模型引入阈值判定,将其直接排除。通过实验分析,双层CNN网络刚性与非刚性的判别准确率达到99%。实验证明,该方法在模型相似性分析上是鲁棒的,且提取的特征不受人工干扰。  相似文献   

18.
为解决传统人脸识别算法手工提取特征困难的问题,将卷积神经网络引入人脸识别任务中。为适应ORL数据集人脸识别任务的需要,参照经典的卷积神经网络模型Lenet-5的结构,提出一种适用于该数据集的CNN结构。实验结果表明,所提出的CNN结构具有较少的学习参数,且在ORL数据集上取得了较高的识别率。与传统人脸识别算法进行比较研究,从实验结果可以看出,在识别正确率上,所提出的卷积神经网络结构优于大多数识别算法。  相似文献   

19.
针对道路交通标志背景复杂多变、现有模型鲁棒性不高以及检测识别过程分步的问题,提出基于感兴趣区域(ROI)提取和卷积神经网络(CNN)相结合的端到端方法.为了突出交通图像中的感兴趣区域,应用MSER方法对原始图像进行颜色增强;应用分割技术生成不同尺度的感兴趣区域(ROI),进一步采用LeNet-5基础模型进行特征提取及区域框标记.为了解决在有限GTSRB数据集上出现的过拟合和网络鲁棒性不强的问题,结构中增加BN层;针对在训练中存在的损失震荡、损失过大等问题,提出使用Adam算法及提前停止的理念,加速了网络训练,稳定降低了损失,提高了识别精度,得到了较高的准确率.  相似文献   

20.
为了改善复杂环境下的人脸识别精度,特别是在当前疫情防控转入常态化的形势下,提升戴口罩场景下的人脸识别精度及红外测温精度至关重要。基于对场景数据的统计和分析,通过对识别参数的动态优化,提升人脸算法识别精度;基于人脸检测的戴口罩检测算法,自动识别是否戴口罩,并针对戴口罩场景采用专用的人脸识别模型,提升人脸识别性能;基于人脸检测的红外测温技术,自动识别测温区域和距离,并对测温结果进行校正,提高测温精度。结果表明,开放场景下识别准确率超过98%;人证核验场景下识别准确率超过93%,戴口罩场景下识别准确率超过92%,红外测温误差小于0.3℃。基于场景适配的参数优化策略,能够在不依赖核心算法性能提升的条件下,使得人脸算法识别性能提升7%;基于人脸检测的红外测温技术,通过温度补偿策略,使得测温误差小于0.3℃。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号