当前位置: 首页 > news >正文

【AI绘画】Stable Diffusion 3开源

Open Release of Stable Diffusion 3 Medium

主要内容

Stable Diffusion 3是Stability AI目前为止最先进的文本转图像开放源代码算法。

这款模型的小巧设计使其完美适合用于消费级PC和笔记本电脑,以及企业级图形处理单元上运行。它已经满足了标准化的文字转图像模型所需要的一切条件,适应市场需求的下一代模型正在到来。

基于 Stable Diffusion 模型,参数数量为20亿的SD3 大型模型,该模型具有诸多显著特点:

总体质量和摄影实效:采用先进的图像处理技术,能够生成精确、色彩饱和且光线自然的图像,同时也可以制作出高品质且多样化风格的输出。利用如16 通道 VAE的创新性技术解决了其他模型经常会遇到的问题,例如手部和面部实体效果不足等问题。

快速理解功能:可以识别且正确处理长度较大、复杂性较高的交互式输入,包括空间思维、组合元素、动作和风格。使用三种或更多的文本编码器,可以为用户提供性能与效率之间的取舍。

字体:利用我们的扩增式变换器结构,大幅降低读写错误、调整空白间隙、书写形成字符和搭配笔画方面的失误。实现了前所未有的文本清晰度,并使输出效果更准确丝滑。

资源效率高:它能够在消费者级的GPU上运行而不会导致性能下降,因为它使用了少量视频内存。

微调优化:可以从小数据集上吸收额外细节,这是一种非常完美的个性定制方法。


与NVIDIA的合作

我们与Nvidia合作,使用其TensorRT技术为稳定概率模型系列产品中的所有版本提高了性能。包括Stable Diffusion 3 Medium在内的所有版本都利用Nvidia® RTX™ GPU和TensorRT™技术,使其在性能方面表现得更好。通过这种方式我们将能够获得最佳性能,并提高50%的性能水平。

下载优化 TensorRT 的Stable Diffusion 3 Medium :https://huggingface.co/stabilityai/stable-diffusion-3-medium-tensorrt。

与AMD的合作

英特尔已对SD3 Medium进行了优化,以匹配包括英特尔最新一代APU、消费级GPU和MI-300X Enterprise Gpu在内的多种AMD设备。

如何启动该程序

下载 Stable Diffusion 3 Medium 绘图的权重:https://huggingface.co/stabilityai/stable-diffusion-3-medium

Diffusers运行:

import torch
from diffusers import StableDiffusion3Pipelinepipe = StableDiffusion3Pipeline.from_pretrained("stabilityai/stable-diffusion-3-medium-diffusers", torch_dtype=torch.float16)
pipe = pipe.to("cuda")image = pipe("A cat holding a sign that says hello world",negative_prompt="",num_inference_steps=28,guidance_scale=7.0,
).images[0]
image

相关文章:

  • Linux3(进程 编辑文件 用户管理 网络)
  • C#A类调用B类的方法,在方法中更新B类的控件
  • c#中上传超过30mb的文件,接口一直报404,小于30mb的却可以上传成功
  • Java多线程-StampedLock(原子读写锁)
  • 小学生期刊知网//《小学生》评职称认可吗?
  • 笔记-前端
  • Android 列表视频滑动自动播放(实现思路)
  • 如何舒适的使用VScode
  • win10 双显卡,双显示器,VGA那个经常出现息屏(待机后无法唤醒),必须重启才能解决,(图文)手把手教你如何处理简单愉快的解决。
  • WinForm之TCP服务端
  • Centos上部署Node服务和MongoDB
  • 【CT】LeetCode手撕—200. 岛屿数量
  • Windows中LoadLibrary加载动态库失败,详细解释(解决思路)
  • Spring Cloud Gateway 详解:构建高效的API网关解决方案
  • 集合并集交集差集【工具类】
  • 【跃迁之路】【444天】程序员高效学习方法论探索系列(实验阶段201-2018.04.25)...
  • Angular 4.x 动态创建组件
  • CentOS6 编译安装 redis-3.2.3
  • chrome扩展demo1-小时钟
  • HTTP那些事
  • js ES6 求数组的交集,并集,还有差集
  • Mybatis初体验
  • PHP的Ev教程三(Periodic watcher)
  • Python学习之路16-使用API
  • Spring Cloud Feign的两种使用姿势
  • Vue全家桶实现一个Web App
  • Web Storage相关
  • windows下mongoDB的环境配置
  • 闭包--闭包作用之保存(一)
  • 不上全站https的网站你们就等着被恶心死吧
  • 电商搜索引擎的架构设计和性能优化
  • 动态规划入门(以爬楼梯为例)
  • 看图轻松理解数据结构与算法系列(基于数组的栈)
  • 聊聊flink的BlobWriter
  • 码农张的Bug人生 - 见面之礼
  • 阿里云服务器购买完整流程
  • #NOIP 2014# day.1 T3 飞扬的小鸟 bird
  • #我与Java虚拟机的故事#连载03:面试过的百度,滴滴,快手都问了这些问题
  • (1综述)从零开始的嵌入式图像图像处理(PI+QT+OpenCV)实战演练
  • (2024,Vision-LSTM,ViL,xLSTM,ViT,ViM,双向扫描)xLSTM 作为通用视觉骨干
  • (Pytorch框架)神经网络输出维度调试,做出我们自己的网络来!!(详细教程~)
  • (附源码)计算机毕业设计SSM智能化管理的仓库管理
  • (九)One-Wire总线-DS18B20
  • (九)信息融合方式简介
  • (十三)MipMap
  • (算法)前K大的和
  • (图)IntelliTrace Tools 跟踪云端程序
  • (一)80c52学习之旅-起始篇
  • .NET 线程 Thread 进程 Process、线程池 pool、Invoke、begininvoke、异步回调
  • .NET 药厂业务系统 CPU爆高分析
  • .NET中使用Redis (二)
  • @PreAuthorize与@Secured注解的区别是什么?
  • @serverendpoint注解_SpringBoot 使用WebSocket打造在线聊天室(基于注解)
  • [2013AAA]On a fractional nonlinear hyperbolic equation arising from relative theory
  • [20171113]修改表结构删除列相关问题4.txt