当前位置: 首页 > news >正文

最强开源文生图模型一夜易主!SD一作、Stabililty AI核心成员Robin Rombach下场创业了,一出手就是王炸。

时隔4个月,开源文生图模型霸主Stable Diffusion原班人马再创业!2024年8月1日官宣:Black Forest Labs成立,公司的第一个产品FLUX.1系列模型包含专业版、开发者版、快速版三种模型,效果直接秒杀Midjourney、DALL-E和Stable Diffusion!目前已获3200万美元融资。

据官方消息,文生图只是一个开始,后续还将发布视频生成模型,准备和Sora和Gen-3等产品过招。

相关链接

推特主页:https://x.com/bfl_ml/status/1819003686011449788

官方新闻:https://blackforestlabs.ai/announcing-black-forest-labs/

三款模型试用地址:

https://replicate.com/black-forest-labs/flux-pro

https://replicate.com/black-forest-labs/flux-dev

https://replicate.com/black-forest-labs/flux-schnell

效果

FLUX.1在文字生成、复杂指令遵循和人手生成上具备优势。以下是其最强的专业版模型FLUX.1[pro]生成图像示例,可以看到即使是生成大段的文字、多个人物,也没有出现字符、人手等细节上的错误。

官方新闻

今天,我们很高兴地宣布成立Black Forest Labs。我们的使命深深扎根于生成式人工智能研究社区,旨在为图像和视频等媒体开发和推进最先进的生成式深度学习模型,并突破创造力、效率和多样性的界限。我们相信,生成式人工智能将成为所有未来技术的基本组成部分。通过向广大受众提供我们的模型,我们希望将其好处带给每个人,教育公众并增强对这些模型安全性的信任。我们决心为生成式媒体打造行业标准。今天,作为实现这一目标的第一步,我们发布了 FLUX.1 模型套件,推动了文本到图像合成的前沿发展。

The Black Forest Team

我们是一支由杰出的 AI 研究人员和工程师组成的团队,在学术、工业和开源环境中开发基础生成式 AI 模型方面拥有出色的业绩。我们的创新包括创建VQGAN和潜在扩散、用于图像和视频生成的稳定扩散模型(Stable Diffusion XL, Stable Video Diffusion, Rectified Flow Transformers)以及用于超快速实时图像合成的对抗扩散蒸馏Adversarial Diffusion Distillation-ADD。

我们的核心信念是,广泛使用的模型不仅能促进研究界和学术界的创新和合作,还能提高透明度,这对于信任和广泛采用至关重要。我们的团队致力于开发最高质量的技术,并让尽可能广泛的受众能够使用它。

资金来源

我们很高兴地宣布,我们成功完成了 3100 万美元的种子轮融资。本轮融资由我们的主要投资者Andreessen Horowitz领投,天使投资者Brendan Iribe、Michael Ovitz、Garry Tan、Timo Aila和Vladlen Koltun以及其他知名的人工智能研究和公司建设专家也参与其中。我们已收到来自General Catalyst和MätchVC的后续投资,以支持我们将欧洲最先进的人工智能带给全世界每个人的使命。

此外,我们很高兴地宣布我们的顾问委员会,包括在内容创作行业拥有丰富经验的Michael Ovitz ,以及神经风格转换的先驱和欧洲开放人工智能研究的领先专家Matthias Bethge 教授。

Flux.1 模型系列

我们发布了 FLUX.1 文本到图像模型套件,为文本到图像合成定义了图像细节、及时遵守、风格多样性和场景复杂性的全新最先进水平。

为了在可访问性和模型功能之间取得平衡,FLUX.1 有三种版本:FLUX.1 [pro]、FLUX.1 [dev] 和 FLUX.1 [schnell]:

  • FLUX.1 [pro]:FLUX.1 的最佳功能,提供最先进的性能图像生成,具有顶级的即时跟踪、视觉质量、图像细节和输出多样性。在此处通过我们的API注册以访问 FLUX.1 [pro] 。FLUX.1 [pro] 也可通过Replicate和fal.ai获得。此外,我们还提供专用和定制的企业解决方案 - 通过flux@blackforestlabs.ai与我们联系。

  • FLUX.1 [dev]:FLUX.1 [dev] 是一种开放权重、指导提炼的模型,适用于非商业应用。FLUX.1 [dev] 直接从 FLUX.1 [pro] 提炼而来,具有相似的质量和及时遵守能力,同时比同等大小的标准模型更高效。FLUX.1 [dev] 权重可在HuggingFace上使用,并可直接在Replicate或Fal.ai上试用。对于商业环境中的应用,请通过flux@blackforestlabs.ai与我们联系。

  • FLUX.1 [schnell]:我们最快的模型是为本地开发和个人使用量身定制的。FLUX.1 [schnell] 在 Apache2.0 许可下公开可用。类似地,FLUX.1 [dev],权重可在 Hugging Face 上使用,推理代码可在GitHub和HuggingFace 的 Diffusers中找到。此外,我们很高兴在第一天就与ComfyUI集成。

图像合成的新基准

FLUX.1 定义了图像合成领域的最新技术。我们的模型在各自的模型类别中树立了新标准。FLUX.1 [pro] 和 [dev] 在以下每个方面都超越了 Midjourney v6.0、DALL·E 3 (HD) 和 SD3-Ultra 等热门模型:视觉质量、快速跟进、尺寸/长宽变化、排版和输出多样性。

FLUX.1 [schnell] 是迄今为止最先进的几步模型,其表现不仅优于同类竞争对手,还优于 Midjourney v6.0 和 DALL·E 3 (HD) 等强大的非蒸馏模型。我们的模型经过专门微调,以保留预训练的整个输出多样性。与目前最先进的技术相比,它们提供了显着改进的可能性,如下所示:

所有 FLUX.1 型号变体均支持 0.1 和 2.0 mp像素的多种宽高比和分辨率,如下例所示。

接下来:SOTA 让所有人都能将文本转为视频

今天,我们发布了 FLUX.1 文本转图像模型套件。凭借强大的创作能力,这些模型为我们即将推出的具有竞争力的生成式文本转视频系统套件奠定了坚实的基础。我们的视频模型将以高清和前所未有的速度实现精确的创作和编辑。我们致力于继续开拓生成媒体的未来。

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • Python 爬虫项目实战(一):爬取某云热歌榜歌曲
  • E23.【C语言】练习:不创建第三个变量实现两个整数的交换
  • 锂电池生产工艺数字化的业务架构.pptx
  • 可视化图表与源代码显示的动态调整
  • vite静态资源处理,处理vite项目中src和url路径问题
  • DedeCMS-V5.7.82-UTF8织梦
  • 复现一下最近学习的漏洞(sqlab 1-10)
  • 速盾:爬虫攻击和cc攻击的区别是什么?
  • Git在日常项目中的实用技巧
  • 汉诺塔(C++)
  • 2024华数杯数学建模A题完整论文讲解(含每一问python代码+结果+可视化图)
  • 总线学习4--UART
  • pom.xml和.m2的setting的区别?
  • 【秋招笔试】24-07-27-OPPO-秋招笔试题(后端卷)
  • ES相关介绍与扫盲
  • 【面试系列】之二:关于js原型
  • Angular4 模板式表单用法以及验证
  • canvas绘制圆角头像
  • create-react-app做的留言板
  • es6要点
  • Javascript Math对象和Date对象常用方法详解
  • Js基础知识(四) - js运行原理与机制
  • WordPress 获取当前文章下的所有附件/获取指定ID文章的附件(图片、文件、视频)...
  • 第十八天-企业应用架构模式-基本模式
  • 力扣(LeetCode)56
  • 猫头鹰的深夜翻译:JDK9 NotNullOrElse方法
  • 前端性能优化--懒加载和预加载
  • 项目管理碎碎念系列之一:干系人管理
  • 鱼骨图 - 如何绘制?
  • 阿里云ACE认证学习知识点梳理
  • 仓管云——企业云erp功能有哪些?
  • ​【C语言】长篇详解,字符系列篇3-----strstr,strtok,strerror字符串函数的使用【图文详解​】
  • ​LeetCode解法汇总1276. 不浪费原料的汉堡制作方案
  • #中的引用型是什么意识_Java中四种引用有什么区别以及应用场景
  • (4)logging(日志模块)
  • (k8s中)docker netty OOM问题记录
  • (LeetCode 49)Anagrams
  • (黑马出品_高级篇_01)SpringCloud+RabbitMQ+Docker+Redis+搜索+分布式
  • (论文阅读笔记)Network planning with deep reinforcement learning
  • (一)Kafka 安全之使用 SASL 进行身份验证 —— JAAS 配置、SASL 配置
  • (转)Mysql的优化设置
  • (转载)从 Java 代码到 Java 堆
  • (自用)learnOpenGL学习总结-高级OpenGL-抗锯齿
  • .net core 6 使用注解自动注入实例,无需构造注入 autowrite4net
  • .Net Core 中间件验签
  • .net 使用ajax控件后如何调用前端脚本
  • .net6+aspose.words导出word并转pdf
  • .Net6使用WebSocket与前端进行通信
  • .net8.0与halcon编程环境构建
  • .NET简谈设计模式之(单件模式)
  • .vimrc 配置项
  • /dev下添加设备节点的方法步骤(通过device_create)
  • :“Failed to access IIS metabase”解决方法
  • @Builder用法
  • @Documented注解的作用