当前位置: 首页 > news >正文

机器学习笔记 - 使用 Pix2Pix 进行图像翻译

一、Pix2Pix概述

        图像翻译适用于各种任务,从简单的照片增强和编辑到更细微的任务,如灰度到 RGB。例如,假设您的任务是图像增强,并且您的数据集是一组正常图像及其增强对应物。这里的目标是学习输入图像与其输出对应物的有效映射。

        Pix2Pix 的作者建立在计算输入-输出映射的基础方法之上,并训练了一个额外的损失函数来加强这种映射。根据Pix2Pix 论文,他们的方法在各种任务中都很有效,包括(但不限于)从分割蒙版合成照片。

        演示1:从边缘生成猫

         演示2:生成建筑表面

         在条件 GAN 的基础上,Pix2Pix 还混合了真实图像和生成图像之间的 L1 距离(两点之间的距离)。

二、生成器

        Pix2Pix 使用 U-Net(下图),因为它具有跳跃连接。U-Net 的特征通常是其第一组下采样层,即瓶颈层,然后是上采样层。这里要记住的关键点是下采样层连接到相应的上采样层,如下图中的虚线所示。

 三、鉴别器

        鉴别器是一个 Patch GAN 鉴别器。普通 GAN 判别器将图像作为输入并输出单个值 0(假)或 1(真实)。补丁 GAN 鉴别器将输入作为本地图像补丁进行分析。它将评估图像中的每个补丁是真实的还是虚假的。

 四、训练过程

        在 Pix2Pix 中,Patch GAN 将接收一对图像:输入掩码和生成图像以及输入掩码和目标图像。这是因为输出取决于输入。因此,将输入图像保持在混合中很重要(如下图所示,其中判别器采用两个输入)。

 

未完

相关文章:

  • 【一起学数据结构与算法】深度学习栈
  • RHCSA知识点汇总
  • Python程序员,你还在用selenium吗?试试Playwright吧
  • STM32Fxx位带操作还不会?哲学三问让你实现位带自由(含位带操作核心代码)以LED与键盘为例
  • 大厂笔试面试总汇目录
  • ESP32 LVGL8.1 M5 Core2 + LVGL + IDF 详细的移植教程 (30)
  • 【论文阅读】Search-Based Testing Approach for Deep Reinforcement Learning Agents
  • c++版模板匹配与特征金字塔结构
  • 软件工程和Maven
  • 基于haarlike特征提取和Adaboost 的红绿灯/人行道检测识别matlab仿真
  • React的高阶组件详解
  • Python基础快速入门
  • FigDraw 22. SCI文章中绘图之核密度及山峦图 (ggridges)
  • 并联四足机器人项目开源教程(一)--- 机器人学导论的学习
  • 【CSS】笔记6-精灵图、字体图标
  • [译]CSS 居中(Center)方法大合集
  • CAP理论的例子讲解
  • Essential Studio for ASP.NET Web Forms 2017 v2,新增自定义树形网格工具栏
  • gitlab-ci配置详解(一)
  • JS实现简单的MVC模式开发小游戏
  • Node + FFmpeg 实现Canvas动画导出视频
  • Vultr 教程目录
  • 对超线程几个不同角度的解释
  • 简单实现一个textarea自适应高度
  • 马上搞懂 GeoJSON
  • 如何胜任知名企业的商业数据分析师?
  • 吴恩达Deep Learning课程练习题参考答案——R语言版
  • 《TCP IP 详解卷1:协议》阅读笔记 - 第六章
  • ###STL(标准模板库)
  • #etcd#安装时出错
  • #我与Java虚拟机的故事#连载19:等我技术变强了,我会去看你的 ​
  • (C语言)字符分类函数
  • (done) NLP “bag-of-words“ 方法 (带有二元分类和多元分类两个例子)词袋模型、BoW
  • (第27天)Oracle 数据泵转换分区表
  • (附源码)python旅游推荐系统 毕业设计 250623
  • (附源码)springboot美食分享系统 毕业设计 612231
  • (附源码)springboot优课在线教学系统 毕业设计 081251
  • (附源码)ssm高校实验室 毕业设计 800008
  • (附源码)ssm考生评分系统 毕业设计 071114
  • .babyk勒索病毒解析:恶意更新如何威胁您的数据安全
  • .cn根服务器被攻击之后
  • .NET 药厂业务系统 CPU爆高分析
  • .NET 中的轻量级线程安全
  • .net/c# memcached 获取所有缓存键(keys)
  • .net对接阿里云CSB服务
  • .net访问oracle数据库性能问题
  • .net图片验证码生成、点击刷新及验证输入是否正确
  • @javax.ws.rs Webservice注解
  • @Transactional 详解
  • [ 转载 ] SharePoint 资料
  • [383] 赎金信 js
  • [Angular] 笔记 21:@ViewChild
  • [BZOJ 4598][Sdoi2016]模式字符串
  • [CareerCup] 17.8 Contiguous Sequence with Largest Sum 连续子序列之和最大
  • [CareerCup] 6.1 Find Heavy Bottle 寻找重瓶子