首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 93 毫秒
1.
为了解决关键点检测精度不均和整体关键点检测精度不高等问题,基于级联特征网络,通过构建主体网络多分支、多阶段、多分辨率的方式从输入图像中提取丰富特征,并通过微调网络中的级联和在线关键点挖掘以提高整体关键点检测精度。采用自顶向下的方法在MPII数据集上与目前先进方法进行对比实验,分别使用20 000张图像进行训练,5 000张图像进行测试。实验结果表明,基于级联特征网络的人体姿态估计方法具有更高的多人姿态估计准确率,平均精度达80.4%,且一些不易识别的关键点检测精度更高。  相似文献   

2.
为高效准确估计出机械臂对未知物体抓取姿态,提出了一种基于深度学习的机械臂抓取姿态估计方法,并设计了相关实验。该方法将生成抓取卷积网络GGCNN与挤压激励(SE)网络模块相结合,提出基于注意力机制的生成抓取卷积网络SE-GGCNN模型,提高抓取姿态估计的准确率。在Cornell数据集和JACQUARD数据集上进行了比较性实验。结果表明,相比于基本的GGCNN模型,SE-GGCNN模型在保证实时性的同时,将IoU指标值由原先的76%提升至82%;对于数据集中未出现过的新对象具备很好的鲁棒性和自适应性;单张图片115 ms的检测用时表明所提出的方法适合实时应用,提升了未知物体抓取姿态估计的准确率。  相似文献   

3.
为增强遮挡场景下所提取行人特征的判别力,有效挖掘样本类别信息,提出了一种基于特征关联和多损失融合的行人再识别方法.首先利用姿态估计器生成的人体关键点作为辅助信息,引导模型关注行人图像未被遮挡区域,提取姿态引导的全局特征;其次引入全局对比池化模块,将平均池化和最大池化的特性进行融合,提取对背景噪声和遮挡抗干扰性更强的全局...  相似文献   

4.
在漫画生成领域,针对现有的基于生成对抗网络(generative adversarial networks, GAN)的方法无法捕获漫画和人脸之间高级对应关系的问题,提出了一个基于注意力机制的生成对抗网络模型(Attentions-based GAN)。在生成器和多尺度鉴别器上创造性地利用不同的注意力模块以保留重要的通道特征和空间特征,保证了鉴别器更准确地区分真实漫画和生成漫画,并促使生成器学习漫画域的分布。此外,构建了一个高分辨率的人脸漫画数据集,并在其上验证了本文模型的有效性。大量实验表明,本文方法生成的漫画更清晰真实,可以保留人物面部的细节并延续漫画的风格。  相似文献   

5.
提出了一种基于噪声特征估计与引导的低剂量CT盲去噪方法.首先,采用有监督特征学习的方式对输入图像的辐射剂量进行等级评估,并估计出图像潜在的噪声特征图.其次,提出了一种基于噪声引导的低剂量CT图像盲去噪模型,通过显性噪声特征引导的方式将噪声特征与原始图像进行融合,并采用残差编码-解码卷积神经网络实现CT图像噪声去除.实验结果表明,在真实数据集上噪声估计网络及特征融合网络能够大幅提升去噪网络的性能,并且在未知剂量CT图像去噪任务上取得了较好的去噪效果.  相似文献   

6.
提出了一种基于多尺度特征注意网络的遥感图像语义分割方法,用于精确的像素级分割问题。通过利用由Transformer主干网络的不同层提取的多尺度特征,设计了一个双向聚合特征金字塔网络来捕获长距离依赖关系和细粒度细节。在网络结构中并行加入一个通道注意分支,从通道维度进行注意力增强以提高分割准确性。通过在两个高分辨率遥感数据集上的实验证明了该方法的有效性,实验结果优于其他分割方法。  相似文献   

7.
特征选择是避免维度诅咒的一种数据预处理技术。在多变量时间序列预测中,为了同时找到与问题相关性最大的变量及其对应时延,提出一种基于多注意力的有监督特征选择方法。该方法利用带有注意力模块和学习模块的深度学习模型,将原始二维时间序列数据正交分割成两组一维数据,分别输入两个不同维度的注意力生成模块,得到特征维度和时间维度的注意权重。两个维度的注意力权值点积叠加作为全局注意力得分进行特征选择,作用于原始数据后输入随学习模块训练不断更新至收敛。实验结果表明,所提出的方法在特征数小于10时可达到全量数据训练效果,与现有几种基线方法相比实现了最佳准确率。  相似文献   

8.
视频人脸表情识别在无人驾驶、智慧医疗等多领域都有广泛应用.针对视频单帧特征提取存在信息损失的问题,提出单帧增强卷积网络,该网络采用浅层特征与深层特征融合实现特征增强,其中浅层特征为CNN中间层外延卷积模块实现浅层特征提取,深层特征为CNN网络最后一层融合空洞卷积和基于通道间注意力机制,实现特征通道重定位和强弱信息结合....  相似文献   

9.
当前利用计算机视觉技术检测学生注意力的方法主要是基于人眼闭合特征和头部偏转特征。当学生处于头部正视、眼睛睁开而视线在看电脑屏幕以外区域时,用以上两种特征无法检测出该类分心情况。针对该问题,提出了一种融合视线检测的注意力检测方法。通过摄像头抓取图像,分析每帧图像中学生的眼睛闭合特征、头部偏转特征以及视线特征,用以判别学生的注意力专注度。实验结果表明,融合视线的注意力检测方法准确性较高,具有一定的实用价值。  相似文献   

10.
本文提出了一种基于坐标注意力机制和梯度残差密集块的融合算法,利用普通卷积提取源图像的浅层特征,使用梯度残差密集块模块提取源图像深层特征和细粒度细节特征;使用坐标注意力模块捕获特征图中空间位置之间的远程依赖关系重,将融合后的特征利用解码器重建融合图像。实验结果说明本文提出的融合算法具有较好的融合性能。  相似文献   

11.
针对语义分割中不同尺度特征融合导致的特征错位问题,提出了一种用于不同尺度语义特征融合的上采样方法。首先,将不同尺度特征图初步融合,将得到的语义信息作为低分辨率特征图进行上采样的位置参照;随后,将低分辨率特征图上采样后,再与高分辨率特征图进行融合。针对神经网络中语义学习模块对语义特征信息学习不充分的问题,提出了一种多方位注意力机制(multi-directional attention mechanism, MAM),从空间、通道和类别3个方位学习语义信息。根据上述2个方面的创新,提出了用于服装图像分割的网络——FMNet,并选取、划分服装数据集DeepFashion2作为训练、验证和测试的数据集。实验结果表明,所提FMNet的平均交并比(mean intersection over union, mIoU)相较于OCRNet提高了2%,相较于DeepLabv3+和PSPNet分别提高了5%和10%。  相似文献   

12.
为了实现基于雷达传感器的人机交互,设计了一个基于深度学习的毫米波雷达手势识别实验。首先,该实验基于77 GHz的FMCW雷达,采集人体手部动作回波数据,并对回波数据进行帧差预处理,再利用多维FFT算法构建距离-速度-角度联合的多维特征融合数据谱图。然后,调用MATLAB中的深度学习工具箱,基于典型的VGG16网络,搭建了适用于多维特征数据提取和动作识别的3D-VGG16-NET网络。实验结果显示,该网络算法对手势的平均识别准确率达到99.38%。  相似文献   

13.
针对动态环境下SLAM算法定位信息精度不足、建图偏移严重问题,本研究基于无人驾驶配送实验平台提出一种面向封闭园区内动态环境的视觉SLAM系统。该系统以ORB_SLAM2为框架,添加了基于人体关键点提取的行为识别线程。在输入图像ORB特征点提取的同时,通过HRNet网络进行人体关键点的提取,通过30帧图像内容进行行为识别,判断图像中人体的行为状态是否为运动,并以此为依据筛选并剔除动态特征点,最后通过静态特征点进行位姿估计。实验结果表明,在TUM数据集动态子序列下,与ORB_SLAM2、DS_SLAM相比,本研究所提算法在系统精度与速度上达到平衡,有效提高了位姿估计的准确性。  相似文献   

14.
针对建筑工地等危险场景下需要对相关人员佩戴安全帽和口罩进行检测,提出基于改进YOLOX-S算法对安全帽和口罩小目标进行同时、实时检测.首先,在YOLOX-S中CSPLayer结构引入ECA注意力机制,引导模型更加关注小目标信息的通道特征,增强模型对有用特征的利用能力;其次,在主干特征提取网络的三个特征层后添加ConvNext Block模块,增强模型对有用特征的利用能力;最后,在加强特征提取网络中引入BiFPN的加权特征融合机制,将原来concat变为BiFPN_concat,增加了对每个输入特征添加可学习的权值,来学习不同输入特征的重要性,区分特征融合过程中不同特征的重要程度,更好关注待检测的目标信息.实验结果表明,改进后算法的mAP为93.2%,比原始YOLOX-S算法平均精确度提升了3.1%.  相似文献   

15.
设计与开发了一个运行在windows200下的轻量级入侵检测系统,系统采用VC++6.0作为开发工具,利用WinPcap技术来捕获网络数据包。在数据包处理方面采用了统计与特征相结合的检测方法,从整体结构而言是一个基于主机的入侵检测系统。文章重点介绍系统总体结构和联动防火墙模块的设计和实现,最后以攻击检测实验加以验证。  相似文献   

16.
汽车车门装配工作已实现流水线式的自动装配,但对于门板零件装配是否到位目前并无有效方案。针对此情况提出了一种基于YOLOv5网络优化的汽车门板装配检测网络,该网络实现对螺钉、焊点、扣件三类装配工艺的检测,可检测在相应装配点位上是否已正确安装。为提高对各装配件装配情况的检测精度,在YOLOv5网络中的卷积模块增加注意力机制,增强主干网络对于高频主干网络的特征学习;其次对原网络中的SPPF感受野扩展模块采用空洞卷积组构造不同大小的感受野范围丰富特征信息,并采用最大值池化层将对特征图中的高频特征信息进行增强,抑制背景噪声的干扰。经试验测试,优化后的网络相比于优化前的精确率(Precision)指标提升2.1%达97.4%,召回率(Recall)指标提升8.4%达97.0%,平均精度均值(mAP)指标提升5.9%达98.1%,有一定的实用性。  相似文献   

17.
为提高样本在分布不均衡情况下的识别精度,提出一种改进的ResNet50卷积神经网络光伏热斑识别算法。首先,为增加初期红外纹理信息流入、调整网络宽度,设计一种头部分组特征提取模块,并将其嵌入到残差网络中,提高网络在图像细微特征方面的提取能力;然后,将通道注意力机制与残差模块相结合,增加网络通道间的热斑特征信息权重,提高模型识别性能和网络收敛速度;最后,通过图像转换HSV颜色空间、平均H分量梯度直方图峰值等数据预处理方法,将负样本转为多分类数据集,并用于热斑识别网络模型,实现热斑识别结果的可视化。实验结果表明,对比其他算法,改进后的ResNet50网络在识别精度上得到显著提高。  相似文献   

18.
人体行走步态特征是一类重要的生物特征,基于步态特征实现生物识别的方法具有较多优势.在分析人体行走步态特征的基础上,讨论了当前步态识别研究中采用的视频获取、目标提取、步态特征检测以及分类识别的主要技术,研究了基于雷达的步态信号提取方法并给出了实验步态信号时频分析结果;分析了当前研究中存在的主要难点.提出了基于视频、雷达等多传感器数据融合提高步态识别能力的方法,讨论了步态识别的应用领域和前景.  相似文献   

19.
基于指纹锁、GSM及人体感应红外的智能远程防盗系统,以STC12C5A60S2微控制器作为主控制芯片,利用Siemens的GSM模块TC35、指纹模块TFS_M12(B)及热释人体红外组合设计而成.实现了指纹锁的相关功能,又巧妙地将其与TC35和人体红外有机融合在一起构成防盗系统.实验效果良好.具体介绍系统的整体构架以及指纹模块、TC35模块、红外模块的应用的同时,重点讲解其硬件设计.  相似文献   

20.
界面的设计,在实现网络教育的教学交互和影响学习者的情感方面起着至关重要的作用。本文在“以学习者为本”的思想指导下,基于对《几何量公差与检测》课程的网络虚拟实验学习环境的设计研究,结合学生上实验课的心理特征和学生在真实实验中的行动过程,设计并实现了具有网络虚拟实验特征的界面。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号