首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 171 毫秒
1.
为了减少基于深度学习动作识别过程中视频图像背景和冗余帧等对识别效果的影响,在深度学习框架中加入注意力机制,提出了一种利用长短时记忆(long short-term memory,LSTM)网络等强化特征提取的方法.首先,改进了数据处理方法,使用融入空间注意力机制的残差网络提取视频中的动作序列空间特征;其次,提出时序注意...  相似文献   

2.
声纳图像目标检测在水下救援和资源勘探中具有重要意义。传统的声纳目标检测技术存在智能化程度低、鲁棒性差、实时性差、识别精度低等问题。尽管许多基于卷积神经网络的目标检测算法在自然图像中取得了很大的成功。然而,对于水下声纳图像来说,海底混响噪声干扰、前景目标区域像素占比低、成像分辨率差等问题对实现准确的水下目标检测提出了相当大的挑战。为了解决这些问题,文章基于YOLOv5目标检测模型提出了一种新的声纳图像目标检测器。首先,在原有Backbone的基础上基于多头注意力机制引入C3MHSA模块和SE注意机制,提高模型的收敛性和提取目标形状和空间有效特征的能力。此外,在Backbone中加入RFB模块,提高网络在高感受野存在的情况下学习重要信息的能力。实验结果表明,改进后的Yolov5网络的m AP@0.5值为98.9%,较原始YOLOv5模型有了全面大幅提升,明显优于现有方法。  相似文献   

3.
随着图像识别分类技术的发展,该技术被人们应用到工农业生产各个领域,以提高其工作质量和效率。在特殊领域背景复杂数据集分类任务中,为增强神经网络的分类能力,降低参数冗余,提高训练效率,提出一种基于注意力机制的DenseNet模型。该神经网络能够通过添加注意力机制获取图像重要信息,以解决数据敏感问题,提高网络整体性能。在复杂树种叶片公开数据集Leafsnap和公共数据集SVHN上分别取得了91.25%和98.27%的分类精确率。实验结果表明,基于注意力机制的DenseNet模型分类效果明显优于其他网络模型。  相似文献   

4.
为提升小目标图像分割性能,提出一种通道注意力联合增强卷积的改进U-Net网络。该网络以增强卷积模块丰富目标特征信息提取,结合通道注意力加强网络对目标特征的专注学习,从而更有效捕捉小目标对象的深层次特征。NIH数据集上的实验结果表明,提出网络在保证计算效率的同时,有效提升了Dice系数、召回率和精确率,能够更好地用于小目标图像分割。  相似文献   

5.
在草莓生长过程中,遭受病虫害种类多且自然背景下难以被准确识别,就此提出一种基于AM-YOLOX草莓病虫害检测算法。该方法以YOLOX-s模型为基础,在网络的不同位置,根据不同注意力机制的作用,融合多种不同的注意力机制,使网络模型能更有效地学习和融合图像特征;引入CIoU目标回归损失函数,提高网络对草莓病虫害的定位精度;在训练阶段,使用Mosaic和Mixup算法进行数据增强,使得网络面对复杂环境有更好的鲁棒性。实验结果表明,AM-YOLOX对7种草莓病虫害的检测有着优异的综合表现,并能最大程度地避免病虫害的误检和漏检。  相似文献   

6.
提出了一种基于多尺度特征注意网络的遥感图像语义分割方法,用于精确的像素级分割问题。通过利用由Transformer主干网络的不同层提取的多尺度特征,设计了一个双向聚合特征金字塔网络来捕获长距离依赖关系和细粒度细节。在网络结构中并行加入一个通道注意分支,从通道维度进行注意力增强以提高分割准确性。通过在两个高分辨率遥感数据集上的实验证明了该方法的有效性,实验结果优于其他分割方法。  相似文献   

7.
有别于RNN和CNN,动态路由与注意力机制为捕捉文本序列的长程和局部依赖关系提供了新思路。为更好地进行文本编码,尽可能多地保留文本特征、增加特征多样性,基于动态路由与注意力机制的思想,整合胶囊网络和自注意力网络的语言信息特征抽取能力,构建一种深度网络模型CapSA,并通过3种不同领域的文本分类实验验证模型效果。实验结果显示,相较于几种基于RNN或CNN的模型,基于CapSA模型的文本分类模型取得了更高的F1值,表明该模型具有更好的文本建模能力。  相似文献   

8.
提出一种基于注意力机制融合轻量化网络的桥梁裂缝图像分类方法。以轻量化卷积神经网络为理论基础分类识别桥梁裂缝图像,并在轻量化网络中加入注意力机制以解决网络无法自主关注所感兴趣区域的问题。根据桥梁图像中裂缝所占比例较小且边缘突出的特点,选用适合于识别桥梁裂缝的注意力机制——CBAM(convolutional block attention module),并将其嵌入轻量化卷积神经网络EfficientNetv2中,建立CBAM-EfficientNetv2模型。实验结果表明:CBAM-EfficientNetv2模型与VGG16、ResNet34等常用深度学习模型对比,可获得最优的桥梁裂缝图像分类效果,其分类识别准确率达到95.64%。  相似文献   

9.
本文提出了一种基于坐标注意力机制和梯度残差密集块的融合算法,利用普通卷积提取源图像的浅层特征,使用梯度残差密集块模块提取源图像深层特征和细粒度细节特征;使用坐标注意力模块捕获特征图中空间位置之间的远程依赖关系重,将融合后的特征利用解码器重建融合图像。实验结果说明本文提出的融合算法具有较好的融合性能。  相似文献   

10.
针对传统点云分类网络不能较好结合全局特征和局部特征信息、导致分类精度不够高的问题,提出一种包含注意力机制的特征融合模型。通过构建多尺度网络,增大网络感受野,从而获得不同程度特征。采用注意力机制进行特征融合,使得局部特征和全局特征相互补偿,增强特征描述符的语义丰富性,获得上下文有效信息,以此提高整体的分类精度。在公开数据集ModelNet 40上对该算法进行验证,取得92.85%的分类精度,验证该网络模型的可行性。  相似文献   

11.
视频人脸表情识别在无人驾驶、智慧医疗等多领域都有广泛应用.针对视频单帧特征提取存在信息损失的问题,提出单帧增强卷积网络,该网络采用浅层特征与深层特征融合实现特征增强,其中浅层特征为CNN中间层外延卷积模块实现浅层特征提取,深层特征为CNN网络最后一层融合空洞卷积和基于通道间注意力机制,实现特征通道重定位和强弱信息结合....  相似文献   

12.
为满足人造板表面缺陷图像分割的精度要求,提出了一种改进的UNet 语义分割网络模型。 在传统的UNet 网络结构上将编码部分改进为残差网络ResNet50 并去掉连接层与平均池化层,网络通过残差块堆叠获取更多特征的底层信息;同时在跳跃连接中嵌入聚焦注意力机制的模块,抑制干扰信息,保留有效位置信息,聚焦缺陷区域并加强学习。 对4 种UNet 网络模型的人造板表面缺陷图像分割进行仿真比较,结果表明,融合聚焦注意力机制的残差UNet 网络模型在像素准确率和平均交并比等指标上有较大提升,分割精度较高。  相似文献   

13.
图像语义分割是计算机视觉领域中的一项重要技术,在自动驾驶、医学影像分析、智能家居和安防监控等领域都有广泛的应用。近年,利用深度学习模型进行图像语义分割的方法得到了广泛关注和研究。然而,深度学习模型很容易出现过拟合问题,并且面对一些存在遮挡、噪声的图像时容易预测出错,从而导致模型分割精度下降。针对这个问题,提出了一种联合注意力机制的U2-Net图像语义分割优化方法,在以VGG为主干网络的U2-Net模型中,增加CBAM注意力模块,使网络模型能够更加关注与分割任务相关的区域,忽略掉一些无关或噪声干扰的区域,增强特征图的表征,进而能够有效地提高模型的性能和泛化能力。实验结果表明,在增加CBAM模块后,U2-Net模型的MIoU及准确率分别提高了8.21%和4%。  相似文献   

14.
当前利用计算机视觉技术检测学生注意力的方法主要是基于人眼闭合特征和头部偏转特征。当学生处于头部正视、眼睛睁开而视线在看电脑屏幕以外区域时,用以上两种特征无法检测出该类分心情况。针对该问题,提出了一种融合视线检测的注意力检测方法。通过摄像头抓取图像,分析每帧图像中学生的眼睛闭合特征、头部偏转特征以及视线特征,用以判别学生的注意力专注度。实验结果表明,融合视线的注意力检测方法准确性较高,具有一定的实用价值。  相似文献   

15.
图像增强是数字图像处理的一类基本技术.图像增强为了改善图像的视觉效果,提高图像的清晰度和工艺的适应性,常常将图像感兴趣的特征有选择的突出,并衰减不需要的特征.本文主要研究基于空域的图像增强算法,探讨了直方图的均衡化、直方图的规定化,以及灰度变换等空域图像增强方法.  相似文献   

16.
提出一种基于小坡变换的图像增强算法.利用小波变换的时频局域性和方向性特点,对分解后的高频系数进行子树划分,以子树为单位实现图像的对比度增强.在VC++环境下实现了该方法,实验结果表明该算法能得到整体视觉好的图像,是一种有效的图像增强算法.  相似文献   

17.
图像空域增强是图像增强中很重要和基础的一大类图像处理技术,而图像增强是后续图像分割和图像分析的基础,因此,图像空域增强在医学图像处理课程中占有重要地位.本文对图像空域增强的实验教学方法进行了研究和探索.  相似文献   

18.
现有评论文本推荐方法多使用静态词向量技术获取评论嵌入,但单词多义性会对语义理解产生偏差,且特征拼接策略无法平衡用户和商品特征对推荐结果的影响.为此,提出了基于评论文本的自适应特征提取推荐模型.该模型使用动态词嵌入预训练模型BERT解决多义性问题,结合Bi-GRU与注意力机制的双向特征提取增强特征表达能力,并以自适应特征...  相似文献   

19.
图像增强旨在改善和提高图像的显示质量,通过梯度进行增强是一种十分有效的方法。图形计算单元(GPU)因为其较高并行性和其特殊的结构特性,正被广泛地应用在算法加速和科学计算领域。为了提高学生对图像增强原理的理解,以及使学生掌握利用GPU进行算法实现的原理与过程,设计了基于GPU的图像增强实验。  相似文献   

20.
为解决表情识别任务中表情特征提取困难和单一的问题,提出一种结合深度残差网络与几何特征的表情识别分法.该方法对深度残差网络进行改进,使用连续小卷积代替大卷积,在各残差块中加入注意力机制,将相同的两个改进残差网络分别作为分支网络,各自提取表情特征,再通过加和平均进行聚合实现特征互补,得到全局特征.采用人脸关键点构建并计算人...  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号