当前位置: 首页 > news >正文

Prompt-Free Diffusion: Taking “Text” out of Text-to-Image Diffusion Models

  • CVPR2024 SHI Labs
  • https://arxiv.org/pdf/2305.16223
  • https://github.com/SHI-Labs/Prompt-Free-Diffusion
  1. 问题引入
  • 在SD模型的基础之上,去掉text prompt,使用reference image作为生成图片语义的指导,optional structure image作为生成图片structure的指导来进行生成;
  • 使用SeeCoder来提取参考图片的embedding作为生成条件,且SeeCoder是可以重复使用的,可以直接集成到另外的T2I模型中;
  1. methods
    在这里插入图片描述
  • 使用SeeCoder代替CLIP text embedding;
  • SeeCoder包含三个部分,Backbone Encoder, Decoder, and Query Transformer,其中Backbone Encoder使用SWIN-L提取多尺度特征,该部分参数是冻结的;之后decoder使用卷积来使得多尺度特征通道数相同,然后进行flatten+concat,得到的结果通过self attn + ffn;之后Query Transformer输出视觉embedding;

相关文章:

  • linux 删除文件(批量删除文件)
  • 跑腿平台小程序的设计
  • 基于自然语言处理的智能客服系统构建:中文AI的实践智慧
  • 论文学习——基于小生境预测策略的动态多目标进化算法
  • 综合项目实战--jenkins流水线
  • 配置并调试后端程序(sql)
  • 建智慧医院核心:智能导航系统的功能全析与实现效益
  • Python 文档字符串(DocStrings)是个啥??
  • 相关款式1111
  • 从0开始搭建Spring-Cloud微服务项目
  • STM32工业自动化控制系统教程
  • promise.all和promise.race的区别
  • 一份适合新手的软件测试练习项目
  • JavaSE (Java基础):面向对象(下)
  • 【计算机毕业设计】026基于微信小程序的原创音乐
  • [笔记] php常见简单功能及函数
  • 【407天】跃迁之路——程序员高效学习方法论探索系列(实验阶段164-2018.03.19)...
  • ECS应用管理最佳实践
  • HTTP请求重发
  • MySQL数据库运维之数据恢复
  • 官方新出的 Kotlin 扩展库 KTX,到底帮你干了什么?
  • 使用 Xcode 的 Target 区分开发和生产环境
  • AI又要和人类“对打”,Deepmind宣布《星战Ⅱ》即将开始 ...
  • ​你们这样子,耽误我的工作进度怎么办?
  • # 学号 2017-2018-20172309 《程序设计与数据结构》实验三报告
  • ###C语言程序设计-----C语言学习(3)#
  • #LLM入门|Prompt#3.3_存储_Memory
  • #我与Java虚拟机的故事#连载07:我放弃了对JVM的进一步学习
  • #周末课堂# 【Linux + JVM + Mysql高级性能优化班】(火热报名中~~~)
  • $.each()与$(selector).each()
  • (2)Java 简介
  • (3)nginx 配置(nginx.conf)
  • (3)选择元素——(14)接触DOM元素(Accessing DOM elements)
  • (delphi11最新学习资料) Object Pascal 学习笔记---第13章第1节 (全局数据、栈和堆)
  • (java)关于Thread的挂起和恢复
  • (顶刊)一个基于分类代理模型的超多目标优化算法
  • (附源码)spring boot球鞋文化交流论坛 毕业设计 141436
  • (简单有案例)前端实现主题切换、动态换肤的两种简单方式
  • (三)uboot源码分析
  • (十)c52学习之旅-定时器实验
  • (十三)Maven插件解析运行机制
  • (四)Controller接口控制器详解(三)
  • (转)大型网站的系统架构
  • (转)用.Net的File控件上传文件的解决方案
  • .Net Winform开发笔记(一)
  • .net 提取注释生成API文档 帮助文档
  • .NET 指南:抽象化实现的基类
  • .NET/C# 利用 Walterlv.WeakEvents 高性能地中转一个自定义的弱事件(可让任意 CLR 事件成为弱事件)
  • .NET/C# 中设置当发生某个特定异常时进入断点(不借助 Visual Studio 的纯代码实现)
  • .NET设计模式(11):组合模式(Composite Pattern)
  • ?.的用法
  • @Autowired和@Resource的区别
  • @for /l %i in (1,1,10) do md %i 批处理自动建立目录
  • [ C++ ] STL_vector -- 迭代器失效问题
  • []T 还是 []*T, 这是一个问题