当前位置: 首页 > news >正文

Cube-Studio:开源大模型全链路一站式中台

开源项目,欢迎star哦,https://github.com/data-infra/cube-studio

一款真正意义的 LLMOps 框架

LLMOps(Large Language Model Operations)是一个涵盖了大型语言模型(如GPT系列)开发、部署、维护和优化的一整套实践和流程,而不仅仅是大模型的应用层。

简介

Cube-Studio是由腾讯音乐开源的一款云原生一站式AI中台,覆盖机器学习/深度学习/LLM大模型,开发、训练、推理、应用,全链路。

github地址:https://github.com/data-infra/cube-studio

该项目目前已是国内最火的开源算法全链路中台,上千家企业私有化部署和项目交付,非常适合数据算法架构团队搭建公司级AI中台,以及toB企业算法中台类项目交付。

LLMOps

cube-studio除了支持原有mlops全链路能力外,新版本增加了很多大模型相关的链路能力。

1. 支持AIHub形式部署40+常用开源大模型:

模型市场中已集成了40+常用开源大模型,包括chatglm4、llama3、qwen2、baichuan2、gemma等,还有openjourney、stable diffusion等文生图模型,并且支持开源模型一键部署,一键开发,一键微调,快速直观地感受大模型。

在这里插入图片描述

提示:除了大模型,另外还有400+开源图文音常规模型。

2. 多层次支持大模型训练微调技术栈:

• 支持tensorflow、pytorch、paddlejob、mindspore、mxnet等分布式多机多卡训练框架;

• 支持deepspeed、megatron、colossalai、horovod、mpi等分布式加速框架;

• 同时支持RDMA网络协议,可以使用底层IB交换机或roce网络;

• 硬件适配英伟达,以及海光、华为、寒武纪、天数智芯等国产设备,支持vgpu。

在这里插入图片描述

提示:除了多机多卡训练,也包含spark/ray/volcano等分布式计算框以及特征处理,文本处理,模型处理等环节。

3. 支持自有数据集一键微调部署:

支持chatglm3、chatglm4、qwen2、baichuan2、llama3等一键微调,集成了llama factory 支持100+LLMs的微调方案;并支持自动发布为推理服务,vllm推理加速,形成openai流接口。

pipeline一键训练推理部署,非常适合不太熟悉大模型微调算法的同学,任务流完成后可以直接对接到其他的openai接口使用的产品中。

在这里插入图片描述

4. 通过智能体构建,构建智能人机交互

• 支持对接外部llm服务厂商接口

• 支持对接内部预训练模型或微调模型llm服务接口

• 支持通过prompt构建领域专家和添加私有知识库

• 支持文生图,语音多模态交互

• 支持支持对接企业oa软件机器人

在这里插入图片描述

在这里插入图片描述

5. 大模型自动化标注

标注是AI中经常出现的任务,cube-studio中集成了开源标注平台label studio,支持图/文/音/多模态/大模型多种类型标注功能,用户管理,工作任务分发,对接数据集,支持标注数据导入;对接pipeline,支持标注结果自动化训练;对接aihub模型市场,支持自动化标注,只需将服务接口配置到label studio中,即可实现通过大模型来自动化标注。

在这里插入图片描述

在这里插入图片描述

提示:除了支持大模型的自动化标注,也支持普通模型图文音的自动化标注。

详细操作
使用参考wiki:https://github.com/data-infra/cube-studio/wiki

相关文章:

  • 千益畅行,旅游卡,如何赚钱?
  • 【区块链+基础设施】国家健康医疗大数据科创平台 | FISCO BCOS应用案例
  • AMSA-UNet | 基于自注意力的多尺度 U-Net 提升图像去模糊性能
  • 「ETL趋势」FDL数据开发支持版本管理、实时管道支持多对一、数据源新增支持神通
  • element-plus Transfer 穿梭框半成品
  • 10年铲屎官亲自体验后,告诉你好用的空气净化器排名
  • Kotlin基础——异步和并发
  • Hadoop集群误删数据紧急恢复详细步骤
  • 从云原生视角看 AI 原生应用架构的实践
  • 爬虫cookie是什么意思
  • 助力游戏实现应用内运营闭环,融云游戏社交方案升级!
  • 【信息系统项目管理师知识点速记】组织通用管理:流程管理
  • kerberos HA高可用部署方案详解
  • 【鸿蒙学习笔记】页面和自定义组件生命周期
  • 使用Swoole开发高性能的Web爬虫
  • C++类中的特殊成员函数
  • CSS3 聊天气泡框以及 inherit、currentColor 关键字
  • Js实现点击查看全文(类似今日头条、知乎日报效果)
  • Magento 1.x 中文订单打印乱码
  • vue-router 实现分析
  • Yii源码解读-服务定位器(Service Locator)
  • 阿里云容器服务区块链解决方案全新升级 支持Hyperledger Fabric v1.1
  • 闭包--闭包作用之保存(一)
  • 表单中readonly的input等标签,禁止光标进入(focus)的几种方式
  • 开源SQL-on-Hadoop系统一览
  • 类orAPI - 收藏集 - 掘金
  • 让你成为前端,后端或全栈开发程序员的进阶指南,一门学到老的技术
  • 设计模式(12)迭代器模式(讲解+应用)
  • 数据仓库的几种建模方法
  • 小程序滚动组件,左边导航栏与右边内容联动效果实现
  • 一个项目push到多个远程Git仓库
  • 移动端 h5开发相关内容总结(三)
  • 应用生命周期终极 DevOps 工具包
  • 用mpvue开发微信小程序
  • 阿里云API、SDK和CLI应用实践方案
  • 函数计算新功能-----支持C#函数
  • 新海诚画集[秒速5センチメートル:樱花抄·春]
  • ​Java并发新构件之Exchanger
  • #mysql 8.0 踩坑日记
  • #经典论文 异质山坡的物理模型 2 有效导水率
  • (2024,Flag-DiT,文本引导的多模态生成,SR,统一的标记化,RoPE、RMSNorm 和流匹配)Lumina-T2X
  • (C语言)逆序输出字符串
  • (echarts)echarts使用时重新加载数据之前的数据存留在图上的问题
  • (javascript)再说document.body.scrollTop的使用问题
  • (JSP)EL——优化登录界面,获取对象,获取数据
  • (二)JAVA使用POI操作excel
  • (二)正点原子I.MX6ULL u-boot移植
  • (十三)MipMap
  • (转) 深度模型优化性能 调参
  • .NET Core6.0 MVC+layui+SqlSugar 简单增删改查
  • .NetCore 如何动态路由
  • .Net环境下的缓存技术介绍
  • .NET正则基础之——正则委托
  • .set 数据导入matlab,设置变量导入选项 - MATLAB setvaropts - MathWorks 中国
  • :O)修改linux硬件时间