当前位置: 首页 > news >正文

Stable diffusion 3 正式开源

6月12日晚,著名开源大模型平台Stability AI正式开源了,文生图片模型Stable Diffusion 3 Medium(以下简称“SD3-M”)权重。

 SD3-M有20亿参数,平均生成图片时间在2—10秒左右推理效率非常高,同时对硬件的需求比同类型也低,这是一款适合PC、手机、平板的大模型。

此外,SD3-M还与英伟达、AMD合作,特地针对RTX GPU 、TensorRT和最新CPU、MI-300X进行了优化,性能最高可提升50%。

开源地址:https://huggingface.co/stabilityai/stable-diffusion-3-medium

免费在线试用:https://huggingface.co/spaces/stabilityai/stable-diffusion-3-medium

根据Stability AI的介绍,SD3-M使用的是多模态扩散变换器 (MMDiT)架构,生成的图片质量、排版、复杂文本提示/语义理解和资源效率方面的性能得到了极大提高。

训练数据集方面,SD3-M使用了包含10亿张图片的公开和合成数据进行了预训练,同时针对特定艺术风格和领域,使用了3000万张图片进行了微调以及300万张偏好图片。

所以,SD3-M对用户的文本提示理解和嵌入图片文字的效果将比前两代更好。根据在线demo,为大家展示一下SD3-M的生成效果。

高耸的摩天大楼、飞驰的汽车和充满活力的全息广告构成的未来主义城市景观

图片

日落时宁静的海滩景色,金色的沙滩,温柔的海浪,一对夫妇手牵手散步

图片

郁郁葱葱的热带雨林,茂密的树叶,五颜六色的鸟类,背景是瀑布。

图片

一家20世纪50年代的老式餐厅,配有棋盘地板、红色乙烯基展位和播放经典摇滚乐的自动点唱机。

图片

一个异想天开的幻想世界,漂浮的岛屿,雄伟的龙在天空中飞翔,下面是迷人的森林。

图片

一个时尚现代的厨房,配有不锈钢器具、大理石台面和一扇俯瞰花园的大窗户。

图片

以上只是部分案例,有兴趣的小伙伴可以通过在线demo免费无限生成。目前SD3-M只能用于学术研究无法商业化。如果想商用需要联系Stability AI进行商业授权。

本文素材来源SD3-M官网,如有侵权请联系删除

END

图片

图片

相关文章:

  • 远程工作岗位机会
  • Leetcode面试经典150题
  • MAC M1系统编译ffmpeg-gl-transition
  • 【 ARMv8/ARMv9 硬件加速系列 3.5.1 -- SVE 谓词寄存器有多少位?】
  • 配置中心理论学习
  • 展厅设计要遵守哪些原则
  • Aptos Builder Jam 亚洲首站|议程公布,无限畅想 Aptos 生态未来
  • CAPL如何在底层模拟TCP Client端断开TCP连接
  • 【HTML】格式化文本 pre 标签
  • ADBMS1818驱动程序解析
  • Spring的启动扩展点机制详解
  • SpringBoot购物网站
  • 基于深度学习网络的USB摄像头实时视频采集与手势检测识别matlab仿真
  • 黑马苍穹外卖2 员工的增查改+异常处理+ThreadLocal
  • Python爬取与可视化-豆瓣电影数据
  • 【知识碎片】第三方登录弹窗效果
  • Angular数据绑定机制
  • emacs初体验
  • HashMap剖析之内部结构
  • Java Agent 学习笔记
  • javascript 总结(常用工具类的封装)
  • js递归,无限分级树形折叠菜单
  • sessionStorage和localStorage
  • Webpack 4x 之路 ( 四 )
  • 浅析微信支付:申请退款、退款回调接口、查询退款
  • 项目实战-Api的解决方案
  • 学习Vue.js的五个小例子
  • 阿里云服务器购买完整流程
  • 没有任何编程基础可以直接学习python语言吗?学会后能够做什么? ...
  • ​ 无限可能性的探索:Amazon Lightsail轻量应用服务器引领数字化时代创新发展
  • ​LeetCode解法汇总1410. HTML 实体解析器
  • ​LeetCode解法汇总2583. 二叉树中的第 K 大层和
  • ​创新驱动,边缘计算领袖:亚马逊云科技海外服务器服务再进化
  • ​如何使用ArcGIS Pro制作渐变河流效果
  • #、%和$符号在OGNL表达式中经常出现
  • #define、const、typedef的差别
  • #我与虚拟机的故事#连载20:周志明虚拟机第 3 版:到底值不值得买?
  • #中国IT界的第一本漂流日记 传递IT正能量# 【分享得“IT漂友”勋章】
  • (+3)1.3敏捷宣言与敏捷过程的特点
  • (003)SlickEdit Unity的补全
  • (8)Linux使用C语言读取proc/stat等cpu使用数据
  • (HAL)STM32F103C6T8——软件模拟I2C驱动0.96寸OLED屏幕
  • (二)正点原子I.MX6ULL u-boot移植
  • (非本人原创)我们工作到底是为了什么?​——HP大中华区总裁孙振耀退休感言(r4笔记第60天)...
  • (九)c52学习之旅-定时器
  • (离散数学)逻辑连接词
  • (亲测有效)解决windows11无法使用1500000波特率的问题
  • (转)AS3正则:元子符,元序列,标志,数量表达符
  • (转)setTimeout 和 setInterval 的区别
  • (自适应手机端)行业协会机构网站模板
  • *++p:p先自+,然后*p,最终为3 ++*p:先*p,即arr[0]=1,然后再++,最终为2 *p++:值为arr[0],即1,该语句执行完毕后,p指向arr[1]
  • .bat批处理(九):替换带有等号=的字符串的子串
  • .htaccess配置重写url引擎
  • .NET HttpWebRequest、WebClient、HttpClient
  • .net mvc 获取url中controller和action