当前位置: 首页 > news >正文

没等来百度惊艳的All in AI,却等来了国产之光的盘古大模型 5.0

6月21日,华为开发者大会(HDC 2024)在广东东莞正式开幕。盘古大模型5.0的更新,也是此次HDC2024的另一项重头戏。在过去的一年中,盘古大模型正在疯狂向各行各业渗透。

此次,华为方面展示了他们在具身智能、医药、气象、铁路、媒体、钢铁等领域的应用。据介绍,一年的时间,盘古大模型已经落地到30多个行业、400多个场景,堪称火箭速度。

盘古大模型5.0超强升级

在这里插入图片描述

盘古大模型5.0包含不同参数规格的模型,以适配不同的业务场景。

  • 十亿级参数的Pangu E系列可支撑手机、PC等端侧的智能应用,无需联网,即可运行小型大模型;

  • 百亿级参数的Pangu P系列,适用于低时延、低成本的推理场景;

  • 千亿级参数的Pangu U系列适用于处理复杂任务,可以成为企业通用大模型的底座;

  • 万亿级参数的Pangu S系列超级大模型是处理跨领域多任务的超级大模型够能帮助企业更好的在全场景应用AI技术。

在这里插入图片描述

特点

1. 强思维

复杂逻辑推理是大模型成为行业助手的关键。

盘古大模型5.0通过结合先进的思维链技术和策略搜索技术,显著提升了其解决数学问题和规划复杂任务的能力。这种提升让盘古大模型5.0在帮助各行业解决问题时,更加出色,能够轻松应对更复杂的逻辑推理挑战。

简单来说,这个升级版的大模型变得更聪明了,可以帮助企业更好地解决困难问题。

2. 多模态

盘古大模型5.0在3.0的基础上,能够进一步理解和生成包括文本、图片、视频、雷达、红外、遥感等更多模态的信息,赋能和重塑千行百业。

在处理图片和视频方面,它支持非常高的分辨率(达到10K),而在内容创造上,则采用了业界首创的可控时空生成技术,这种技术特别适用于自动驾驶、工业制造和建筑等领域,可以创建符合物理规律的多模态内容。

例如,使用这个模型,在多模态识别方面,它能够通过分析卫星遥感图片来判断农作物的生长情况,帮助预测产量或监测病虫害;利用红外技术,能在夜间准确识别车辆位置,帮助管理交通违规停车;同时,结合可见光和雷达数据,盘古5.0能够评估一个区域的植被覆盖情况,辅助自然保护工作。

当前,算力也是阻碍大模型行业发展的一道难关。除了盘古大模型的创新升级,华为云还对昇腾AI云服务进行持续优化。

比如,行业中万亿参数模型训练的平均无中断时长大概是2.8天,而采用昇腾AI云服务时,可实现40天无中断;业界平均集群故障恢复时间约60分钟,而昇腾AI云服务可以缩短到10分钟,同时能将大模型的资源开通时间从月级缩短到天级。

目前,昇腾AI云服务已全面适配行业主流的100多个大模型,以云服务的方式,帮助客户开发,训练,托管和应用模型。

盘古大模型,如何落到各行各业?

在过去的一年中,盘古大模型持续深耕行业,已在30多个行业、400多个场景中落地,在政务、金融、制造、医药研发、煤矿、钢铁、铁路、自动驾驶、工业设计、建筑设计、气象等领域发挥作用。

  • 自动驾驶
    华为云盘古大模型5.0采用了先进的可控时空生成技术(STCG),使其生成的视频在视觉效果上不仅逼真,更在车辆行为和环境互动等方面高度仿真,确保了在不同视角、天气和光照条件下的自然连贯性。

    此外,模型还为自动驾驶系统提供了全方位、高仿真度的训练视频,这些视频从六个不同的摄像头视角展示了从空旷街道到复杂的多车互动场景,并涵盖了多种气候条件,显著增强了数据集的丰富性和多样性。

    在技术细节上,该模型能够精确模拟雨天环境下车辆尾灯因暗淡光线而自动开启的情形,展现了其对真实世界复杂现象的深入理解与模拟能力。这一技术不仅提升了训练素材的质量,也为自动驾驶研究和开发提供了强大的支持。
    在这里插入图片描述

  • 让汽车设计更快
    据介绍,在汽车造型设计领域,盘古大模型已成功将传统的1-2年设计周期显著缩短。

    比如,设计师可以通过对话和绘图与大模型交互,快速生成并调整3D汽车模型,包括风格、零部件和颜色的定制。而这些数字模型可以直接输出为多种主流3D格式,允许设计师直接进行3D打印,从而减少了传统油泥模型的需求,大幅节约了成本和时间。

    盘古大模型还将应用范围还扩展到了汽车的工装设计、模具设计以及电子产品的工业设计等领域。

  • 从草图到建筑大师作品,仅需数十分钟
    华为云的盘古大模型通过其可控生成能力,让建筑师可以仅凭一张黑白草图快速生成带有纹理的彩色建筑群360°实景视频。

    此外,利用盘古的3D重建技术,建筑师能够在短短几十分钟内构建出高度真实感的建筑3D模型,大幅度缩短了复杂建筑群的概念设计周期,原本需要数周的时间现在只需数十分钟。这一突破性技术不仅提高了设计效率,还帮助建筑师创作出更加卓越的建筑作品。

    在这里插入图片描述

  • 让实拍视频流畅变成动漫
    通过华为云盘古媒体大模型,可以将实拍视频转换为不同风格的高清动漫。

    比如,在现场演示的生成视频中,演员的舞蹈、武打等大运动轨迹能保持一致视觉效果,角色的面貌特征也保持前后一致。这意味着,将大大提升视频制作效率,作品一次拍摄可以多次制作。

    语音也是视频中很重要的一环。在语音方面,盘古大模型通过AI原声译制与视频生成能力,能够让原片译制成不同语言的视频,并保留原始角色的音色、情感和语气。更为重要的是,盘古还能同步生成新的口型。

    在AI翻译方面,华为云盘古大模型也对云会议系统进行了升级。通过基于大模型的语音复刻、AI文字翻译以及TTS技术,实现了语音的同声传译,这使得不同国家的人在云视频会议中,也可以流畅使用母语交流。

  • 大模型,让钢铁公司每年多产2万吨钢
    在钢铁领域,华为盘古大模型已经开始发挥作用。比如,宝武钢铁集团热轧生产线里,在一块厚260mm的钢坯被轧制成1.2毫米厚的钢板前,需要经过20道工序,且每次调整生产钢板的种类和尺寸时,都需要工程师重新调整,一次需要耗费约5天的时间。

    而有了盘古大模型的帮助,将时序数据、表格数据、工艺参数、行业机理等token化,通过大模型的学习,实现对最优的参数进行预测,显著降低了热轧生产线调优时间,并提高预测精度和钢板成材率。

    从效果来看,盘古大模型在钢铁行业的预测精度提高5%以上,钢板成材率提升0.5%,预计每年可以多产钢板2万余吨,年收益达9000余万元。此外,华为云还与宝武钢铁集团在炼钢、表检、新钢种研发、排程优化等多个领域开展盘古大模型的应用研究。

  • 预测天气
    此次,华为盘古气象大模型也在推进更高难度的公里级区域预报,实现了从全球25公里模型向1公里、3公里、5公里区域预报精度的跨越,包含气温、降雨、风速等气象要素。

    值得注意的是,气象大模型的应用范围已经延伸至行业服务,扩展到污染物预测、农业生产指导等多个领域,成为支持各行各业决策的重要工具。

    尤其是在环境治理方面,华为云与天融环境公司的合作推出了“环境大模型”,将污染六项的预测准确度全面提升10%以上,并且将预测窗口从3天提前至7天,为环保部门提供了更长的预警时间,有助于更加高效地进行污染源的定位与治理。

    在这里插入图片描述

  • 当大模型学习了一千本古籍
    在医药领域,天士力基于盘古大模型打造“数智本草大模型”。

    一方面基于盘古L0能力,学习训练了378万篇文献等数据,尤其是学习了1000多本古籍,从古方古籍和现代文献中总结出知识和经验,可以赋能方剂筛选和优化、提升研发效率,也能辅助医生问诊。

    另一方面,天士力在盘古17亿化合物的药物分子大模型基础上,增训了350万天然产物分子数据,未来有望更好地优化方剂和发现新药。

“夸父”机器人

盘古具身智能大模型是人形机器人的灵魂,会上还展示了乐聚公司搭载该模型的“夸父”人形机器人。

据介绍,盘古大模型能够让机器人完成10步以上的复杂任务规划,并且在任务执行中实现多场景泛化和多任务处理。

同时盘古大模型还能生成机器人需要的训练视频,让机器人更快地学习各种复杂场景。

大模型的多模态能力以及思维能力的快速提升,使机器人能够模拟人类常识进行逻辑推理,并在现实环境中高效精准地执行任务,从而有效解决了复杂环境感知与物理空间认知的难题。

通过集成多场景泛化和多任务处理能力,不论是生活场景还是工业场景,都能游刃有余的应对。

在这里插入图片描述

个人评价

总之,和老黄在宝岛上的发布会有点遥相契合的感觉。但是毋庸置疑的是 AI 时代已经到来,而他终究会对世界产生巨大的影响, 同时,对于00后和10后,甚至20后而言,AI终将会是我们未来最为丰富的宝库。

感谢大家花时间阅读我的文章,你们的支持是我不断前进的动力。期望未来能为大家带来更多有价值的内容,请多多关注我的动态!

相关文章:

  • java-正则表达式 1
  • Android使用MPAndroidChart 绘制折线图
  • Java学习 - MySQL存储过程、函数和触发器练习实例
  • Java中的设计模式:实战案例分享
  • labelme使用笔记:目标检测数据集标注和语义分割数据集批量生成
  • kafka第二篇——主题创建,主题分区副本分配策略
  • PWR电源控制
  • IDEA services模块无法启动springboot服务(添加了springboot但是为空白)
  • HTTP/2 的 ALPN(应用层协议协商)
  • 【前端】Git 常用
  • C语言| 宏定义
  • Python 学习 第四册 第10章 系统(2)
  • OpenCV图像变换
  • React的State和setState
  • Flink——最流批的大数据框架(流批一体)
  • [ JavaScript ] 数据结构与算法 —— 链表
  • [分享]iOS开发-关于在xcode中引用文件夹右边出现问号的解决办法
  • Akka系列(七):Actor持久化之Akka persistence
  • C++11: atomic 头文件
  • ComponentOne 2017 V2版本正式发布
  • flutter的key在widget list的作用以及必要性
  • JavaScript的使用你知道几种?(上)
  • js继承的实现方法
  • k个最大的数及变种小结
  • SpringBoot几种定时任务的实现方式
  • SpringCloud集成分布式事务LCN (一)
  • Vim Clutch | 面向脚踏板编程……
  • Yii源码解读-服务定位器(Service Locator)
  • 极限编程 (Extreme Programming) - 发布计划 (Release Planning)
  • 理解在java “”i=i++;”所发生的事情
  • 聊聊hikari连接池的leakDetectionThreshold
  • 浅谈web中前端模板引擎的使用
  • 悄悄地说一个bug
  • 算法系列——算法入门之递归分而治之思想的实现
  • 微信公众号开发小记——5.python微信红包
  • 微信支付JSAPI,实测!终极方案
  • 一个JAVA程序员成长之路分享
  • 再次简单明了总结flex布局,一看就懂...
  • 【运维趟坑回忆录 开篇】初入初创, 一脸懵
  • 资深实践篇 | 基于Kubernetes 1.61的Kubernetes Scheduler 调度详解 ...
  • #、%和$符号在OGNL表达式中经常出现
  • #多叉树深度遍历_结合深度学习的视频编码方法--帧内预测
  • (04)Hive的相关概念——order by 、sort by、distribute by 、cluster by
  • (C++哈希表01)
  • (C语言)求出1,2,5三个数不同个数组合为100的组合个数
  • (顶刊)一个基于分类代理模型的超多目标优化算法
  • (分布式缓存)Redis分片集群
  • (附源码)springboot 智能停车场系统 毕业设计065415
  • (附源码)springboot课程在线考试系统 毕业设计 655127
  • (计算机网络)物理层
  • (论文阅读30/100)Convolutional Pose Machines
  • (南京观海微电子)——I3C协议介绍
  • (亲测有效)解决windows11无法使用1500000波特率的问题
  • (全注解开发)学习Spring-MVC的第三天
  • (转) SpringBoot:使用spring-boot-devtools进行热部署以及不生效的问题解决