打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
ICCV2019|基于语义连贯性的图像修复,全新的迭代 Coherent Attention 机制提升修复效果,已开源

加入极市专业CV交流群,与6000+来自腾讯,华为,百度,北大,清华,中科院等名企名校视觉开发者互动交流!更有机会与李开复老师等大牛群内互动!

同时提供每月大咖直播分享、真实项目需求对接、干货资讯汇总,行业技术交流。关注 极市平台 公众号 ,回复 加群,立刻申请入群~

本文为极市原创,如需转载,请联系小助手微信( cv-mart )

引言

以往图像修复的工作没有考虑特征连续性从而导致修复色彩或线条断层的问题,本文提出了一种全新的迭代 Coherent Attention 机制, 保证了生成特征连续性以及全局语义信息的一致性。同时我们提出了一个新的 Consistency loss配合我们的Attention层,从而保证Attention层及其对应的解码器层的特征分布一致性。最后我们设计了一个新的特征补丁辨别器对修复细节进行加强。

论文链接:https://arxiv.org/abs/1905.12384
代码链接:https://github.com/KumapowerLIU/CSA-inpainting

以往的图像修复,往往没有考虑像素之间的连续性,映射到语义上来说就是没有考虑特征的连续性,从而导致色彩的断层或者线条的断层。如下图所示:

图中shift-net和Contextual Attention都是专做中心修复的,可以明显看出色彩的断层。而PC和GC用于随机马赛克修复,可以看出明显的人工修复痕迹。

论文的方法整体架构:

模型整体架构

模型分为粗修复和精细修复两个步骤,其中粗修复(Rough net)用的是pix to pix文章中的U-net网络,快并且效果不错. 精细修复网络(Refinement network)整体也是U-net架构,其中每个卷积分成两次完成,第一次是升降维度,第二次是up or down sample, 类似于分离卷积,不过降维用的3×3的卷积,采样用的空洞卷积。连贯性语义注意力机制(Coherent semantic attention)在32×32×256那一层,这一层效果不错并且时间消耗不多,这个在消融实验中有验证。

Coherent semantic attention

这个attention分成两个部分,第一部分称为搜索阶段,第二部分称为生成阶段


‍‍其中蓝色区域为马赛克区域,灰色为上下文区域,我需要针对蓝色区域中每一个点找到最相关的上下文区域并且替换进来,这样所有的马赛克区域就都被上下文区域填满,再进行第二步生成阶段。生成阶段中,我们采用光标扫描的方式从上至下从左至右进行生成,最左上角第一个补丁没有先前的生成补丁,所以
但是
由于前面有生成补丁,所以
应该与
构建联系,

其中 

之间的attention值,
是在搜索阶段 
与最相关上下文补丁计算的attention值. 由于
会包含
的信息,所以
会包含 
的信息,
会包含 
的信息,并且随着距离的增长,补丁之间的关系会越弱。最终可以总结成:

Consistency loss:

由于整体结构用的U-net架构,所以我们要保证编码器和解码器对应层需要语义一致性,并且要让Coherent semantic attention层能够更好的工作,所以我们用VGG提取原图的特征空间,并将这个特征空间作为CSA(Coherent semantic attention)层和其对应的解码器层的标签并计算L2距离,这样就能够保证编码器和解码器对应层需要语义一致性并且提升CSA的效果。

Feature patch discriminator:

feature patch discriminator

我们用VGG提取图片的特征空间,并在这个特征空间上利用patch discriminator进行对抗损失计算,这样能够更加好的帮助生成器理解图像信息,同时稳定辨别器训练

下面是实验展示图:


-End-

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
李飞飞等提出新的迭代视觉推理框架,在ADE上实现8.4 ﹪的绝对提升
计算机视觉八大任务全概述:PaddlePaddle工程师详解热门视觉模型
能同时做三个分割任务的模型,性能和效率优于MaskFormer!Meta&UIUC提出通用分割模型,性能优于任务特定模型!开源!
Attention SLAM:一种从人类注意中学习的视觉单目SLAM
别用GPT-4直出文本摘要!MIT、哥大等发布全新「密度链」提示:实体密度是摘要质量的关键
ECCV2020 Oral|基于互编解码器以及特征均衡化的图像修复
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服