当前位置: 首页 > news >正文

Perceptual Losses for Real-Time Style Transfer and Super-Resolution and Super-Resolution 论文笔记...

 

Perceptual Losses for Real-Time Style Transfer and Super-Resolution and Super-Resolution 论文笔记

ECCV 2016 

 

摘要: 许多经典问题可以看做是 图像转换问题(image transformation tasks)。本文所提出的方法来解决的图像转换问题,是以监督训练的方式,训练一个前向传播的网络,利用的就是图像像素级之间的误差。这种方法在测试的时候非常有效,因为仅仅需要一次前向传播即可。但是,像素级的误差 没有捕获 输出和 gt 图像之间的 感知区别(perceptual differences)。

  与此同时,最近的工作表明,高质量的图像可以通过 perceptual loss function 来生成,不依赖于像素之间的差别,而是 高层图像特征之间的差别。图像正是基于这种特征之间的 loss 进行训练的。这种方法可以产生高质量的图像,但是速度却很慢,因为需要解决一个优化问题。

  本文中,我们将两者的优势进行结合,训练一个前向传播的网络进行图像转换的任务,但是不用 pixel-level loss function,而采用 perceptual loss function。在训练的过程中,感知误差 衡量了图像之间的相似性,在测试的时候可以实时的进行转换。

 

 

 

网络的训练:

  网络主要由两个部分构成:一个是 image transformation network 一个是 loss network 用来定义 loss function。图像转换网络 是一个残差网络,它将输入图像转换为输出图像 y^。每个损失函数计算一个 scalar value 衡量输出图像和目标图像之间的不同。图像转换网络 是通过 SGD 进行训练的,利用加权的损失函数,如下所示:

   

  为了解决 per-pixel losses 的缺陷,并且允许我们的 loss function 可以更好的衡量 感知和语义的区别,我们从最近的通过优化来产生图像得到了启发。关键点在于:这些方法用到的网络已经是学习到编码感知和语义信息,这些网络都是在分类的数据集上进行训练后的。我们所以就用这些网络来固定的作为 loss network 来定义我们的损失函数。

 

  刚开始看那个流程图的时候,比较糊涂的是两个 target,$y_c$ 和 $y_s$ 。其实是这样子的:

  对于每一个图像 x ,我们有一个 content target $y_c$ 和 一个 style target $y_s$。

  

  对于 style transfer 来说,the content target $y_c$ 是输入图像 x,the output image y^ 应该 结合 the content x = $y_c$ 和 $y_s$ 的 style 。

  

  对于 超分辨来说,输入图像 x 是一个低分辨率的图像,the content target $y_c$ 是一个 gt 高分辨率的图像,style reconstruction loss 没有用到。对于一种超分辨的因子,我们就训练一种网络。

 

 


 

   实验结果:

  

 

相关文章:

  • 微服务学习笔记二:Eureka服务注册发现
  • php知识总结(二)
  • Java]Socket和ServerSocket服务器端接受数据
  • Cmakelists.txt中间部分模板
  • Native 性能稳定性极致优化
  • OpenGL中的二维编程——从简单的矩形开始
  • Laravel 建站随笔
  • PHP面向对象深入研究之【命名空间】与【自动加载类】
  • Lucene的各中文分词比较
  • altiium designer改变图纸大小
  • 自动化Oracle数据库静默安装
  • 数字1的数量
  • 消息中间件的应用——谈谈秒杀(转)
  • 买二手房不如买新房
  • 基本数据结构——栈
  • [nginx文档翻译系列] 控制nginx
  • 2017-08-04 前端日报
  • angular组件开发
  • egg(89)--egg之redis的发布和订阅
  • Laravel5.4 Queues队列学习
  • leetcode388. Longest Absolute File Path
  • Node项目之评分系统(二)- 数据库设计
  • Spark学习笔记之相关记录
  • Vue ES6 Jade Scss Webpack Gulp
  • Vue源码解析(二)Vue的双向绑定讲解及实现
  • 工作中总结前端开发流程--vue项目
  • 解析 Webpack中import、require、按需加载的执行过程
  • 什么软件可以提取视频中的音频制作成手机铃声
  • 通过来模仿稀土掘金个人页面的布局来学习使用CoordinatorLayout
  • 新手搭建网站的主要流程
  • - 转 Ext2.0 form使用实例
  • 资深实践篇 | 基于Kubernetes 1.61的Kubernetes Scheduler 调度详解 ...
  • # Python csv、xlsx、json、二进制(MP3) 文件读写基本使用
  • #define与typedef区别
  • (MATLAB)第五章-矩阵运算
  • (solr系列:一)使用tomcat部署solr服务
  • (附源码)基于SSM多源异构数据关联技术构建智能校园-计算机毕设 64366
  • (论文阅读31/100)Stacked hourglass networks for human pose estimation
  • (四)库存超卖案例实战——优化redis分布式锁
  • (算法设计与分析)第一章算法概述-习题
  • (图)IntelliTrace Tools 跟踪云端程序
  • (一)python发送HTTP 请求的两种方式(get和post )
  • (转)C#开发微信门户及应用(1)--开始使用微信接口
  • (转)为C# Windows服务添加安装程序
  • .locked1、locked勒索病毒解密方法|勒索病毒解决|勒索病毒恢复|数据库修复
  • .net 4.0发布后不能正常显示图片问题
  • .NET CORE 2.0发布后没有 VIEWS视图页面文件
  • .NET 程序如何获取图片的宽高(框架自带多种方法的不同性能)
  • .NET 反射的使用
  • .NET 命令行参数包含应用程序路径吗?
  • .Net转前端开发-启航篇,如何定制博客园主题
  • @selector(..)警告提示
  • @Transactional 详解
  • [ Linux Audio 篇 ] 音频开发入门基础知识
  • [【JSON2WEB】 13 基于REST2SQL 和 Amis 的 SQL 查询分析器