基于中文发音视觉特点的唇语识别方法研究|何珊;袁家斌;陆要要|南京航空航天大学信息化处,南京 211106 - 期刊导航|首站-论文投稿智能助手|论文发表|论文智能投稿|期刊自助发表推荐|杂志社快速发表|查同导刊-域田数据官方网站

首站-论文投稿智能助手

首页

期刊导航

职称导航

中图分类号

典型文献

基于中文发音视觉特点的唇语识别方法研究

文献摘要：

随着深度学习的发展,唇语识别技术在英文方面取得了长足的进步,但针对中文无论是在数据集丰富性还是识别准确率上均存在一定的落差.通过分析中文发音的视觉特点,提出"视觉拼音",意图规避中文在视觉表达上的歧义性.为了验证视觉拼音的有效性,建立了中文句子级唇语识别模型CHSLR-VP.该模型是一个端到端结构,其中以视觉拼音为媒介,将视频帧序列转换成最终的汉字语句.通过实验得出,相比于其他唇语识别方法,基于视觉拼音建立的CHSLR-VP模型性能更优,证明了视觉拼音的参与可明显提高中文唇语识别的准确率,为将来的相关工作提供了基准.

文献关键词：

唇语识别;视觉拼音;深度学习;卷积神经网络(CNN);序列到序列模型;注意机制

中图分类号：

[1] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391） / 模式识别与装置（TP391.4）

[2] 自动化技术、计算机技术（TP） / 计算技术、计算机技术（TP3） / 计算机的应用（TP39） / 信息处理(信息加工)（TP391）

[3] 自动化技术、计算机技术（TP） / 自动化基础理论（TP1） / 人工智能理论（TP18） / 人工神经网络与计算（TP183）

作者姓名：

何珊;袁家斌;陆要要

作者机构：

南京航空航天大学计算机科学与技术学院,南京 211106;南京航空航天大学信息化处,南京 211106

文献出处：

计算机工程与应用

引用格式：

[1]何珊;袁家斌;陆要要-.基于中文发音视觉特点的唇语识别方法研究)[J].计算机工程与应用,2022(04):157-162

A类：

视觉拼音,CHSLR

B类：

文发,发音,音视,唇语识别,丰富性,识别准确率,落差,视觉表达,歧义性,文句,句子级,识别模型,VP,端到端,视频帧,序列转换,转换成,汉字,语句,模型性能,序列到序列模型,注意机制

AB值：

0.273472

相似文献

针对唇语识别的上下文相关性蒸馏方法

赵雅;冯尊磊;王慧琼;宋明黎-浙江大学计算机科学与技术学院杭州 310027;浙江大学软件学院杭州 310027;浙江大学宁波研究院宁波 315100;之江实验室杭州 311121

基于RNN和注意力机制的双向人体姿态补全方法

杨韫韬;聂勇伟;张青;李平;李桂清-华南理工大学计算机科学与工程学院广州 510006;中山大学计算机学院广州 510006;香港理工大学电子计算学系与设计学院香港 999077

卷积神经网络表征可视化研究综述

司念文;张文林;屈丹;罗向阳;常禾雨;牛铜-信息工程大学信息系统工程学院郑州450001;信息工程大学网络空间安全学院郑州450001;信息工程大学密码工程学院郑州450001

基于Vision Transformer的中文唇语识别

薛峰;洪自坤;李书杰;李雨;谢胤岑-合肥工业大学软件学院合肥230601;合肥工业大学计算机与信息学院合肥230601

基于生成对抗网络和网络集成的面部表情识别方法EE-GAN

杨鼎康;黄帅;王顺利;翟鹏;李一丹;张立华-复旦大学工程与应用技术研究院,上海200433;上海智能机器人工程技术研究中心,上海200433;智能机器人教育部工程研究中心,上海200433;季华实验室,广东佛山528200;吉林省人工智能与无人系统工程研究中心,长春130000

基于单标签射频识别的唇语识别算法

张瑛琪;彭大卫;李森;孙莹;牛强-中国矿业大学计算机科学与技术学院,江苏徐州221116

融合多语义特征的命名实体识别方法

左亚尧;陈皓宇;陈致然;洪嘉伟;陈坤-广东工业大学计算机学院,广州510006

基于全文索引知识图谱的危化品运输地址匹配研究

刘斐;贺向阳;邹志云-华中科技大学土木与水利工程学院,武汉430074;宁波交通发展研究中心,浙江宁波315042

基于深度学习的视频行为识别技术综述

李晨;何明;王勇;罗玲;韩伟-陆军工程大学指挥控制工程学院,南京210007

多层注意力机制融合的序列到序列中国连续手语识别和翻译

周乐员;张剑华;袁甜甜;陈胜勇-天津理工大学计算机科学与工程学院天津300382;天津理工大学聋人工学院天津300382

融合字根信息的卷积神经网络中文分词方法

王星;于丽美;陈吉-辽宁工程技术大学电子与信息工程学院,辽宁葫芦岛125105

基于多尺度融合注意力机制的人脸表情识别研究

史浩;邢瑜航;陈炼-南昌大学信息工程学院,江西南昌330031

基于改进注意力机制的问题生成模型研究

易也难;卞艺杰-河海大学商学院,江苏南京211100

融合时空域特征的人脸表情识别

陈拓;邢帅;杨文武;金剑秋-浙江工商大学计算机与信息工程学院,杭州 310018

双视图三维卷积网络的工业装箱行为识别

胡海洋;潘健;李忠金-杭州电子科技大学计算机学院,杭州 310018

融合通道层注意力机制的多支路卷积网络抑郁症识别

孙浩浩;邵珠宏;尚媛园;孙晓妮;胡强;孔佑勇-首都师范大学信息工程学院,北京 100048;上海交通大学医学院附属精神卫生中心,上海 200030;上海交通大学生物医学工程学院,上海 200240;东南大学计算机科学与工程学院,南京 210096

基于改进BiGRU-CNN的中文文本分类方法

陈可嘉;刘惠-福州大学经济与管理学院,福州 350116

基于改进的ResNet网络的人脸表情识别

周婕;马明栋-南京邮电大学通信与信息工程学院,江苏南京 210003;南京邮电大学地理与生物信息学院,江苏南京 210003

基于特征融合的中文分词研究

张倩;高建瓴;丁容-贵州大学大数据与信息工程学院,贵阳550025

基于轻量化网络MobileNetV2的玉米病害识别研究

叶名炀;张杰强-华南农业大学电子工程学院(人工智能学院),广州 510642

机标中图分类号，由域田数据科技根据网络公开资料自动分析生成，仅供学习研究参考。