当前位置: 首页 > news >正文

Improving Diffusion Models for AuthenticVirtual Try-on in the Wild # 论文阅读

URL

https://arxiv.org/pdf/2403.05139
主页:https://arxiv.org/pdf/2403.05139

TL;DR

24 年 3 月韩国的一篇文章,用 reference net 做换装
在这里插入图片描述

Model & Method

ppl 如下图,和之前认知的 reference net 的区别是,本文训练的是 denoising unet 而不是 reference net。

  • 待替换的服装 + 该服装详细的 caption 作为 reference net 的输入,提取 feature 之后通过 self attn 注入 denoising net 中。
  • 参考人物图提取衣服的前背景 + 3dmm 之后,concat 到一起送入到 denoising unet 里。
  • 同时要替换的服装也会通过 ipdapter + cross attn 提取语义特征注入到 denoising unet 内。
  • 两个 unet 的 text prompt 是不同的
    在这里插入图片描述

Dataset & Results

Thought

  • 思路反过来了,不训练 reference net,训练 denoising net。这样的话可以让 reference net 发挥想要的作用吗?
  • 分治的思路值得参考:
    • id 和物体特征信息分别通过 cross attn、self-attn 方式注入。
    • 物体特征信息又细分了 semantic、fine-grained 特征,通过不同网络提取出来 concat 到一起去,然后注入 self-attn

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 翻译《The Old New Thing》- The importance of the FORMAT_MESSAGE_IGNORE_INSERTS flag
  • pillow学习6
  • LeetCode题练习与总结:从中序与后序遍历序列构造二叉树--106
  • amis中 InputTable Combo InputKV/InputKVS 区别
  • 数据库DCL语句
  • ES基础概念
  • freertos串口DMA队列发送卡死
  • Java的函数式接口和 Lambda 表达式
  • ICML 2024 Mamba 论文总结
  • Vue3判断变量和对象不为null和undefined
  • 为了性能,放弃tft_eSPI,选择arduino_gfx吧
  • Mysql 的 binlog 有几种格式?
  • 用Python Pygame做的一些好玩的小游戏
  • 【大数据】MapReduce JAVA API编程实践及适用场景介绍
  • 自回归模型(二):具有自回归误差的回归
  • (十五)java多线程之并发集合ArrayBlockingQueue
  • @jsonView过滤属性
  • 【159天】尚学堂高琪Java300集视频精华笔记(128)
  • 【剑指offer】让抽象问题具体化
  • ES6语法详解(一)
  • Essential Studio for ASP.NET Web Forms 2017 v2,新增自定义树形网格工具栏
  • github从入门到放弃(1)
  • JAVA多线程机制解析-volatilesynchronized
  • js 实现textarea输入字数提示
  • JS专题之继承
  • mysql_config not found
  • MySQL常见的两种存储引擎:MyISAM与InnoDB的爱恨情仇
  • PAT A1050
  • RedisSerializer之JdkSerializationRedisSerializer分析
  • V4L2视频输入框架概述
  • Vue.js 移动端适配之 vw 解决方案
  • 聊聊redis的数据结构的应用
  • 每天10道Java面试题,跟我走,offer有!
  • 如何在 Tornado 中实现 Middleware
  • 适配iPhoneX、iPhoneXs、iPhoneXs Max、iPhoneXr 屏幕尺寸及安全区域
  • 微服务核心架构梳理
  • 移动端 h5开发相关内容总结(三)
  • 用 Swift 编写面向协议的视图
  • 数据可视化之下发图实践
  • 组复制官方翻译九、Group Replication Technical Details
  • ​​​​​​​GitLab 之 GitLab-Runner 安装,配置与问题汇总
  • ​【数据结构与算法】冒泡排序:简单易懂的排序算法解析
  • ​业务双活的数据切换思路设计(下)
  • # 睡眠3秒_床上这样睡觉的人,睡眠质量多半不好
  • # 再次尝试 连接失败_无线WiFi无法连接到网络怎么办【解决方法】
  • (2022版)一套教程搞定k8s安装到实战 | RBAC
  • (C语言)编写程序将一个4×4的数组进行顺时针旋转90度后输出。
  • (SERIES12)DM性能优化
  • (第30天)二叉树阶段总结
  • (翻译)Quartz官方教程——第一课:Quartz入门
  • (附源码)ssm高校升本考试管理系统 毕业设计 201631
  • (含react-draggable库以及相关BUG如何解决)固定在左上方某盒子内(如按钮)添加可拖动功能,使用react hook语法实现
  • (佳作)两轮平衡小车(原理图、PCB、程序源码、BOM等)
  • (四)搭建容器云管理平台笔记—安装ETCD(不使用证书)
  • (一)Spring Cloud 直击微服务作用、架构应用、hystrix降级