腾讯优图实验室13篇论文入选ICCV2019

  • 时间:
  • 浏览:1
  • 来源:1分赛车网投平台-3分彩投注平台_3分快3娱乐平台

两年一度的国际计算机视觉大会 (International Conference on Computer Vision,ICCV) 将于 2019 年 10 月 27 日 - 11 月 2 日在韩国首尔举行,近日论文收录名单揭晓,腾讯优图共有13篇论文入选

两年一度的国际计算机视觉大会 (International Conference on Computer Vision,ICCV) 将于 2019 年 10 月 27 日 - 11 月 2 日在韩国首尔举行,近日论文收录名单揭晓,腾讯优图共有13篇论文入选,居业界实验室前列,其中3篇被选做口头报告(Oral),该类论文仅占总投稿数的4.3%(400/4323)。

ICCV被誉为计算机视觉领域三大顶级会议之一(另外五个 为CVPR、ECCV),录用率非常低,其论文集代表了计算机视觉领域最新的发展方向和水平。本届ICCV共收到4323篇论文投稿,其中1075篇被录用,录取率25%。

本次入选的论文涉及2D图像多视图生成、人脸照片的图像转换等,提出了诸多亮点。

下面将对腾讯优图入选的两篇论文进行重点解析。

1、基于视角无关社会形态的多视图对抗生成框架View Independent Generative Adversarial Network for Novel View Synthesis

本论文与香港中文大学合作协议协议完成。

2D图像的多视图生成任务,指的是基于单张2D图像,生成其不同视角下的图像信息。此类最好的法律法律依据后能 在不涉及比较复杂的三维重建的基础上,实现多个视角下的信息的合成观察。相似下图中给定特定视角的2D图像,后能 生成某些各个视角的图像信息:

该论文提出了一种生活生活适用于此类任务的对抗生成框架,旨在通过结合图像对应的相机参数信息,实现对于多类物体均适用的多视角转换框架。长远来看,这项技术的应用有望让普通的2D视频后能 实现3D观感,就像在电影院观看的3D电影一样。

现有的多视图生成任务中,当前基于生成模型的最好的法律法律依据将预先提取输入图像中与视角信息无关的社会形态,而后将视角信息相关的参数作用于此社会形态,进而得到生成的结果。该论文中,作者使用此种思路,配合以多种损失函数的设置,利用相机参数加在图像信息来得到与视角无关的社会形态。相比于现有的最好的法律法律依据,该最好的法律法律依据适用于连续相机参数下的多视图生成,不必限制于数个固定的视角。

除了合成视图与监督信息之间的损失函数之外,本文提出使用一种生活生活基于循环生成的重建损失函数,来提升合成视图的准确性;一起去借鉴目前的对抗生成技术,从图像一种生活生活的生成分布,与图像的姿态准确性保证两方面出发,提出五个 不同作用的对抗学习损失,以提升生成图像的质量和合成视图的姿态准确度。

该框架后能 适用于不相似别的物体。

首先是人脸在预先设定的有限数目的视角之间的转换结果。最左边是输入的2D图像,箭头右侧均为生成的,不同视角下的结果。

应对某些一般的物体。通过在Shape-Net你你这个 数据集上的多个类别物体作为数据,得到以下结果:

通过在多个类别的物体上进行多视图生成任务,利用多个定量定性指标来进行评价,证明该最好的法律法律依据具有通用性,且在多个类别任务上表现良好。

本文入选ICCV 2019口头报告(Oral),该类论文录取率约4.3%。

论文地址: http://jiaya.me/papers/vigan_iccv19.pdf

2、基于属性自光流域的非监督图像转换算法 Attribute-Driven Spontaneous Motion in Unpaired Image Translation



微笑表情转换结果图。从左到右依次为:输入、StarGAN结果、该论文结果

本论文与香港中文大学、哈工大深圳研究院合作协议协议完成。

人脸照片随着社交软件的普及被大幅度地应用于各种社交应用中,而人脸照片的自动化编辑一方面作为何交软件的娱乐应用利于了社交用户的交流,被委托人面也帮助用户对人脸照片进行快速的自动化编辑。肯能深层学习的兴起,基于深层神经网络的图像转换(Image translation)技术常常被应用于图像编辑任务上。

现有的图像变换算法主要基于生成对抗神经网络,哪些算法尽管能生成较高分辨率的图像,但肯能它们较少考虑图像之间的几何变形关系,转换后的图像往往中含某些瑕疵和失真,尤其是在原图像域和目标图像域几何社会形态不一致的状况下。

本论文提出了SPM(自光流模块),希望通过学习不同图像域间的光流正确处理图像的几何变换现象。其框架以传统的生成器-判别器作为基础,其中,生成器用于生成更好的图像,而判别器用于判别生成器生成图像的质量好坏,此外,某些人在生成器的基础网络社会形态上做出扩展以适应图像转换之中的几何变换。扩展后的生成器中含五个 主要模块,自光流模块SPM和微调模块R。此外,该论文还引入了从低分辨率图像到高分辨率的生成方案。

整体框架图

本文提出的自光流模块,通过输入原图像和目标属性,自光流域模块旨在预测光流,并利用光流对原图像采用变形操作得到上边结果图像。该论文利用一五个 编码-解码网络作为该模块的主要社会形态,其中某些人主要考虑了网络社会形态、域分类器、微调模块、残差社会形态、注意力掩码几方面的设计。

一起去,为了产生更高分辨率的图像,该论文采用了一种生活生活新颖的粗到细的神经网络训练策略。

在训练好低分辨的神经网络前会有某些上边结果的低分辨率表示。具体地,低分辨率的自光流域w残差r以及注意力掩码m是已知的。为了得到它们的高分辨率表示,首先对它们进行双线性插值上采样到分辨率更高的w, r以及m。之后通过双线性插值的上采样所得到的结果往往是模糊的,之后对于你你这个 五个 变量某些人引入了五个 小的增强神经网络对上采样的结果进行微调。利用微调后的高分辨率上边结果,某些人即可对高分辨率的输入图像进行正确处理和转换,并最后得到相应的高分辨转换结果。

RaFD数据集上的图像转换结果,从左到右依次为:输入、愤怒、惊恐、开心(后五个 为算法生成结果)

本论文通过提出自光流模块,将图像域间的几何变换显式地引入到了图像转换框架中。算法主要在CelebA-HQ和RaFD数据集上进行验证,其结果相比于现有算法前会 一定的提升。其各偏离 的实验充分证明了该框架的有效性,之后取得了很好的图像转换效果。你你这个 框架也给正确处理图像转换中的几何变换疑现象供了新的正确处理思路。

(本内容属于网络转载,文中涉及图片等内容如有侵权,请联系编辑删除)

猜你喜欢

一加6高清渲染图曝光:“刘海”全面屏,搭载骁龙845

IT之家4月4日消息 昨天,一加手机官方签署了一加6手机将至,搭载最新的高通骁龙845防止器,随后总要有8GB内存+256GB存储版本。现在一加6手机的高清渲染图曝光,确认了刘

2020-01-26

速度最快的Surface,微软Surface Studio 2开启预订:24276元起

IT之家11月15日消息在10月初,微软在纽约带来了最新的Surface Studio2,微软称其为“史上最快的Surface”。现在Surface Studio2在微软美国商

2020-01-26

致远互联2019年度红叶联盟年会圆满收官:协同共生 助推数字化变革

12月18日,由中国协同管理软件及云服务领先厂商致远互联(股票代码:688369)主办的“协同共生,共赢未来红叶联盟年会暨企业数字化研讨会”在京成功召开。现场来自中粮贸易(大连

2020-01-26

新年开运之选 畅销平板大搜罗

新的一年因为来到,面对全新的机遇与挑战,选取一台既促使力工作、又能为娱乐加分的平板电脑作为开运之物也是极好的!今天,小编就很糙为你们搜罗几款实力与魅力并重的畅销平板,正在茫茫机

2020-01-26

靶向蛋白质降解技术助力攻克三阴性乳腺癌

乳腺癌作为中国四十岁的女人 第一高发恶性肿瘤,发病率呈逐年上升趋势。随着早期筛查技术和综合治疗技术的发展,乳腺癌的疗效得到显著的改善。根据美国国立癌症研究所(NCI)的数据,

2020-01-26