当前位置: 首页 > news >正文

GLM大模型 - CogVideoX:5B 开源,2B 转为 Apache 协议

8月6日,我们发布并开源了CogVideoX-2B模型,受到广大开发者的欢迎。

为了促进社区的自主使用和开放式创新,我们现决定将参数规模更大、性能更强的产品级模型 CogVideoX-5B 开源,同时 CogVideoX-2B 的开源协议调整为更加开放的Apache 2.0协议。

CogVideoX-2B 升级

自8月6日发布以来,CogVideoX-2B 在推理设备门槛上已有显著优化:

  • 支持多种推理精度,包括 FP16、BF16、FP32、INT8 等;

  • 在 INT8 精度下,推理显存需求仅为 7.8GB,即使用 1080 Ti 显卡也可以完成推理;

  • 在 FP16/BF16 精度,Step=50 的设定下,单卡 A100 仅需 90 秒完成推理,单卡 H100 仅需 45 秒;

  • LoRA 微调显存需求为 47GB,SFT 微调为 62GB,单卡 A100(80GB)即可满足微调需求。

CogVideoX-5B 开源

CogVideoX-5B 模型相较于 CogVideoX-2B 拥有更高的视频生成质量,并在工程优化上保持了一致的高标准:

  • 同样支持多种推理精度;

  • 推理显存需求最低仅为 11.4GB,即单张 3060 显卡即可完成推理;

  • LoRA 微调显存需求为 63GB,SFT 微调为 75GB,单卡 A100(80GB)同样可以完成微调任务。

为进一步支持开源社区的广泛使用与开发,我们已将 CogVideoX-2B 的协议调整为 Apache 2.0,任何企业与个人均可自由使用。

同时,我们推出了在线体验,并将其源代码开源,涵盖了插帧、超分辨率等先进功能,均采用开源技术方案,实现全流程开源。

代码仓库:https://github.com/THUDM/CogVideo

模型论文:https://arxiv.org/abs/2408.06072

模型下载:

  • Huggingface:https://huggingface.co/THUDM/CogVideoX-5b

  • 魔搭社区:https://modelscope.cn/models/ZhipuAI/CogVideoX-5b

在线体验:

  • Huggingface:https://huggingface.co/spaces/THUDM/CogVideoX-5B-Space

  • 魔搭社区:https://modelscope.cn/studios/ZhipuAI/CogVideoX-5b-demo

下面为模型参数概要:

图片

Demo

Promt:A lone boy, clad in a rugged oilskin jacket and boots, stands bravely atop a tiny, bobbing boat amidst a tumultuous sea, its waves crashing and foam swirling as a fierce storm rages around him. In the distance, an enormous, fearsome whale emerges, its gargantuan mouth agape, threatening to engulf the boy and his vessel. Undeterred, the boy grips his trusty weapon tightly, a look of fierce determination etched upon his face, and prepares to strike back at the monstrous creature, the salty wind whipping through his hair as he readies for the confrontation. 

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • nginx实验
  • C++ 多线程(互斥锁、条件变量)
  • SQL server 2008 获取当前年,季度 和月的最后一天
  • 游戏开发设计模式之装饰模式
  • Java新版主要特性|2024年最后一个版本即将到来
  • DataWhale AI夏令营 2024大运河杯-数据开发应用创新赛-task2
  • 源代码防泄露迎来信创时代:信创沙箱
  • 数据分析之Python对数据分组排序
  • TESSY创建单元测试或集成测试工程
  • 基于NNG的六种通信模式
  • 【运维类】信息化项目运维方案(word)
  • day44——C++对C的扩充
  • Spring(面试篇)
  • Linux:SQLite 数据库
  • #QT 笔记一
  • [LeetCode] Wiggle Sort
  • 【从零开始安装kubernetes-1.7.3】2.flannel、docker以及Harbor的配置以及作用
  • android高仿小视频、应用锁、3种存储库、QQ小红点动画、仿支付宝图表等源码...
  • Java应用性能调优
  • js面向对象
  • Vue实战(四)登录/注册页的实现
  • 不发不行!Netty集成文字图片聊天室外加TCP/IP软硬件通信
  • 更好理解的面向对象的Javascript 1 —— 动态类型和多态
  • 构建二叉树进行数值数组的去重及优化
  • 记录一下第一次使用npm
  • 漫谈开发设计中的一些“原则”及“设计哲学”
  • -- 数据结构 顺序表 --Java
  • 为物联网而生:高性能时间序列数据库HiTSDB商业化首发!
  • 宾利慕尚创始人典藏版国内首秀,2025年前实现全系车型电动化 | 2019上海车展 ...
  • # 数仓建模:如何构建主题宽表模型?
  • #java学习笔记(面向对象)----(未完结)
  • $L^p$ 调和函数恒为零
  • $nextTick的使用场景介绍
  • (06)Hive——正则表达式
  • (2)空速传感器
  • (k8s)Kubernetes 从0到1容器编排之旅
  • (编程语言界的丐帮 C#).NET MD5 HASH 哈希 加密 与JAVA 互通
  • (论文阅读11/100)Fast R-CNN
  • (亲测成功)在centos7.5上安装kvm,通过VNC远程连接并创建多台ubuntu虚拟机(ubuntu server版本)...
  • (深度全面解析)ChatGPT的重大更新给创业者带来了哪些红利机会
  • (四)opengl函数加载和错误处理
  • (五)Python 垃圾回收机制
  • (原創) 如何解决make kernel时『clock skew detected』的warning? (OS) (Linux)
  • .NET/C# 利用 Walterlv.WeakEvents 高性能地中转一个自定义的弱事件(可让任意 CLR 事件成为弱事件)
  • .netcore 如何获取系统中所有session_ASP.NET Core如何解决分布式Session一致性问题
  • .Net多线程总结
  • .net和php怎么连接,php和apache之间如何连接
  • .NET应用架构设计:原则、模式与实践 目录预览
  • .sh文件怎么运行_创建优化的Go镜像文件以及踩过的坑
  • .考试倒计时43天!来提分啦!
  • @manytomany 保存后数据被删除_[Windows] 数据恢复软件RStudio v8.14.179675 便携特别版...
  • @RequestMapping 和 @GetMapping等子注解的区别及其用法
  • @开发者,一文搞懂什么是 C# 计时器!
  • [ C++ ] STL_list 使用及其模拟实现
  • [2]十道算法题【Java实现】