首站-论文投稿智能助手
典型文献
基于轻量化Yolov5算法的目标检测系统
文献摘要:
针对现有的深度目标检测算法结构复杂、计算量过大,难以直接部署到资源有限的边缘设备进行实时检测应用的问题,以Yolov5算法为基础,针对VOC公开数据集在GPU上进行迭代训练,通过使用MobileNetv2替换Backbone特征提取层中的BottleneckCSP结构、Conv替换Focus模块达到网络轻量化,并结合稀疏训练评价特征提取层中卷积核的重要性后进行减枝的方法进一步实现模型压缩.从模型适应平台硬件加速角度出发,根据瑞芯微Rk3399pro加速芯片MAC单元为3的倍数,提出将网络卷积通道数剪枝后约束为9的倍数,并引入了非对称8位模型量化、CPU-GPU-NPU多核协同工作的策略在嵌入式平台上进行C++算法部署.实验证明,轻量化的Yolov5算法在检测精确度mAP下降6.74的情况下,大幅减少了计算参数量,离线模型部署至Rk3399pro嵌入式平台上理论检测速度达到50 fps/s,相较原Yolov5s未优化改进的部署至平台上的速度提升近1.7倍;满足降低模型参数权重后仍能实时精确检测的效果.
文献关键词:
目标检测网络;深度可分离卷积;模型量化;减枝;硬件加速;嵌入式部署
作者姓名:
张利红;蔡敬菊
作者机构:
中国科学院 光电技术研究所,四川 成都 610209;中国科学院大学,北京 100049
引用格式:
[1]张利红;蔡敬菊-.基于轻量化Yolov5算法的目标检测系统)[J].计算机技术与发展,2022(11):134-139
A类:
减枝,Rk3399pro
B类:
目标检测算法,算法结构,计算量,量过大,边缘设备,实时检测,检测应用,VOC,公开数据集,GPU,迭代训练,MobileNetv2,Backbone,BottleneckCSP,Conv,Focus,网络轻量化,稀疏训练,卷积核,模型压缩,硬件加速,MAC,倍数,通道数,剪枝,模型量化,CPU,NPU,多核,协同工作,嵌入式平台,C++,法部,检测精确度,mAP,计算参数,参数量,离线模型,模型部署,检测速度,fps,Yolov5s,优化改进,精确检测,目标检测网络,深度可分离卷积,嵌入式部署
AB值:
0.487997
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。