当前位置：首页 > news >正文

机器学习笔记 - 使用 Pix2Pix 进行图像翻译

news 来源：原创 2024/5/20 14:26:46

一、Pix2Pix概述

图像翻译适用于各种任务，从简单的照片增强和编辑到更细微的任务，如灰度到 RGB。例如，假设您的任务是图像增强，并且您的数据集是一组正常图像及其增强对应物。这里的目标是学习输入图像与其输出对应物的有效映射。

Pix2Pix 的作者建立在计算输入-输出映射的基础方法之上，并训练了一个额外的损失函数来加强这种映射。根据Pix2Pix 论文，他们的方法在各种任务中都很有效，包括（但不限于）从分割蒙版合成照片。

演示1：从边缘生成猫

演示2：生成建筑表面

在条件 GAN 的基础上，Pix2Pix 还混合了真实图像和生成图像之间的 L1 距离（两点之间的距离）。

二、生成器

Pix2Pix 使用 U-Net（下图），因为它具有跳跃连接。U-Net 的特征通常是其第一组下采样层，即瓶颈层，然后是上采样层。这里要记住的关键点是下采样层连接到相应的上采样层，如下图中的虚线所示。

三、鉴别器

鉴别器是一个 Patch GAN 鉴别器。普通 GAN 判别器将图像作为输入并输出单个值 0（假）或 1（真实）。补丁 GAN 鉴别器将输入作为本地图像补丁进行分析。它将评估图像中的每个补丁是真实的还是虚假的。

四、训练过程

在 Pix2Pix 中，Patch GAN 将接收一对图像：输入掩码和生成图像以及输入掩码和目标图像。这是因为输出取决于输入。因此，将输入图像保持在混合中很重要（如下图所示，其中判别器采用两个输入）。

未完

【一起学数据结构与算法】深度学习栈

RHCSA知识点汇总

Python程序员，你还在用selenium吗？试试Playwright吧

STM32Fxx位带操作还不会？哲学三问让你实现位带自由（含位带操作核心代码）以LED与键盘为例

大厂笔试面试总汇目录

ESP32 LVGL8.1 M5 Core2 + LVGL + IDF 详细的移植教程 (30)

【论文阅读】Search-Based Testing Approach for Deep Reinforcement Learning Agents

c++版模板匹配与特征金字塔结构

软件工程和Maven

基于haarlike特征提取和Adaboost 的红绿灯/人行道检测识别matlab仿真

React的高阶组件详解

Python基础快速入门

FigDraw 22. SCI文章中绘图之核密度及山峦图 (ggridges)

并联四足机器人项目开源教程（一）--- 机器人学导论的学习

【CSS】笔记6-精灵图、字体图标

[译]CSS 居中（Center）方法大合集

CAP理论的例子讲解

Essential Studio for ASP.NET Web Forms 2017 v2，新增自定义树形网格工具栏

gitlab-ci配置详解(一)

JS实现简单的MVC模式开发小游戏

Node + FFmpeg 实现Canvas动画导出视频

Vultr 教程目录

对超线程几个不同角度的解释

简单实现一个textarea自适应高度

马上搞懂 GeoJSON

如何胜任知名企业的商业数据分析师？

吴恩达Deep Learning课程练习题参考答案——R语言版

《TCP IP 详解卷1：协议》阅读笔记 - 第六章

###STL(标准模板库)

#etcd#安装时出错

#我与Java虚拟机的故事#连载19：等我技术变强了，我会去看你的

（C语言）字符分类函数

(done) NLP “bag-of-words“ 方法（带有二元分类和多元分类两个例子）词袋模型、BoW

（第27天）Oracle 数据泵转换分区表

（附源码）python旅游推荐系统毕业设计 250623

（附源码）springboot美食分享系统毕业设计 612231

（附源码）springboot优课在线教学系统毕业设计 081251

（附源码）ssm高校实验室毕业设计 800008

（附源码）ssm考生评分系统毕业设计 071114

.babyk勒索病毒解析：恶意更新如何威胁您的数据安全

.cn根服务器被攻击之后

.NET 药厂业务系统 CPU爆高分析

.NET 中的轻量级线程安全

.net/c# memcached 获取所有缓存键(keys)

.net对接阿里云CSB服务

.net访问oracle数据库性能问题

.net图片验证码生成、点击刷新及验证输入是否正确

@javax.ws.rs Webservice注解

@Transactional 详解

[ 转载 ] SharePoint 资料

[383] 赎金信 js

[Angular] 笔记 21：@ViewChild

[BZOJ 4598][Sdoi2016]模式字符串

[CareerCup] 17.8 Contiguous Sequence with Largest Sum 连续子序列之和最大

[CareerCup] 6.1 Find Heavy Bottle 寻找重瓶子

一、Pix2Pix概述

二、生成器

三、鉴别器

四、训练过程

相关文章：