首站-论文投稿智能助手
典型文献
基于文本强化与多分支卷积的文本检测方法
文献摘要:
自然场景下的文本检测技术是多种工业应用的前提,但常用检测方法的准确率不佳.为此提出一种基于文本强化与多分支卷积的神经网络方法,用于检测自然场景中的图片文本.首先,在主干网络前加入文本区域强化的网络结构,在浅层网络提高文本区域的特征值,加强网络对文本特征的学习能力并抑制背景特征的表达.其次,针对场景文本高宽比差异大的特点,设计多分支结构的卷积模块,用接近文本形状的卷积核来表达差异化的感受野,并通过轻量级的注意力机制,补充网络对通道重要性的学习,其参数量仅为通道数的六倍.最后,改进损失函数在分类损失和检测框损失上的计算公式,对文本像素进行加权并引入覆盖预测框和标签框的最小矩形来表达重合度,提高网络在文本数据集上的训练有效性.消融实验和对比实验的结果表明,该方法的各个改进措施有效,在IC-DAR2015和MSRA-TD500数据集上的分别取得了 83.3%和82.4%的F值,同时在模糊文本、光斑文本和密集文本等困难样本的检测对比中表现较好.
文献关键词:
神经网络;文本检测;图像处理;注意力机制;损失函数
作者姓名:
屠程力;陈章进;乔栋
作者机构:
上海大学微电子研究与开发中心,上海200444;上海大学计算中心,上海200444
引用格式:
[1]屠程力;陈章进;乔栋-.基于文本强化与多分支卷积的文本检测方法)[J].微电子学与计算机,2022(11):69-77
A类:
TD500
B类:
文本检测,自然场景,工业应用,神经网络方法,主干网络,本区,文本特征,背景特征,高宽比,多分支结构,卷积模块,卷积核,表达差异,感受野,轻量级,注意力机制,参数量,通道数,六倍,损失函数,像素,覆盖预测,重合度,文本数据,消融实验,IC,DAR2015,MSRA,模糊文本,光斑,困难样本
AB值:
0.395669
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。