典型文献
基于自编码器生成对抗网络的可配置文本图像编辑
文献摘要:
基于文本的图像编辑是多媒体领域的一个研究热点并具有重要的应用价值.由于它是根据给定的文本编辑源图像,而文本和图像的跨模态差异很大,因此它是一项很具有挑战的任务.在对编辑过程的直接控制和修正上,目前方法难以有效地实现,但图像编辑是用户喜好导向的,提高可控性可以绕过或强化某些编辑模块以获得用户偏爱的结果.针对该问题,提出一种基于自动编码器的文本图像编辑模型.为了提供便捷且直接的交互配置和编辑接口,该模型在多层级生成对抗网络中引入自动编码器,该自动编码器统一多层级间高维特征空间为颜色空间,从而可以对该颜色空间下的中间编辑结果进行直接修正.其次,为了增强编辑图像细节及提高可控性,构造了对称细节修正模块,它以源图像和编辑图像为对称可交换输入,融合文本特征以对前面输入编辑图像进行修正.在MS-COCO和CUB200数据集上的实验表明,该模型可以有效地基于语言描述自动编辑图像,同时可以便捷且友好地修正编辑效果.
文献关键词:
基于文本的图像编辑;生成对抗网络;交互编辑
中图分类号:
作者姓名:
吴福祥;程俊
作者机构:
中国科学院深圳先进技术研究院广东省机器人与智能系统重点实验室,广东深圳518055
文献出处:
引用格式:
[1]吴福祥;程俊-.基于自编码器生成对抗网络的可配置文本图像编辑)[J].软件学报,2022(09):3139-3151
A类:
基于文本的图像编辑,交互编辑
B类:
自编码器,生成对抗网络,可配置,文本图像,多媒体,文本编辑,和图像,跨模态,模态差异,正上,前方,喜好,可控性,绕过,得用,偏爱,自动编码器,交互配置,多层级,一多,高维特征空间,颜色空间,可交换,文本特征,入编,COCO,CUB200,正编
AB值:
0.291648
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。