典型文献
基于均方误差的8位深度神经网络量化
文献摘要:
为模型量化后具有更高的准确度,提出以量化均方误差(QMSE)为指标的确定量化系数的方法,针对量化后性能损失严重的小型网络,进一步提出更新统计参数(USP)的方法.QMSE将量化过程中的舍入和截断操作产生的噪声相结合,以此作为选取合适量化系数的指标;USP通过更新批次归一化层中的均值和方差,矫正模型量化产生的均值和方差偏移.实验结果表明,在不进行重训练的情况下,使用QMSE+USP对常见的深度神经网络量化,模型性能优于其它算法.
文献关键词:
深度神经网络;模型压缩;量化;卷积神经网络;均方误差
中图分类号:
作者姓名:
冯鹏程;禹龙;田生伟;耿俊;龚国良
作者机构:
新疆大学 信息科学与工程学院,新疆 乌鲁木齐 830046;新疆大学 软件工程技术重点实验室,新疆 乌鲁木齐 830008;新疆大学 网络中心,新疆 乌鲁木齐 830046;新疆大学 软件学院,新疆 乌鲁木齐 830008;中国科学院半导体研究所 高速电路与神经网络实验室,北京 100083
文献出处:
引用格式:
[1]冯鹏程;禹龙;田生伟;耿俊;龚国良-.基于均方误差的8位深度神经网络量化)[J].计算机工程与设计,2022(05):1258-1264
A类:
QMSE,QMSE+USP
B类:
均方误差,深度神经网络,模型量化,定量化,更新统,统计参数,舍入,模型性能,模型压缩
AB值:
0.233964
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。