当前位置: 首页 > news >正文

AI工具新革命:从ChatGPT到Sora,生成式AI改变世界

这个春节着实精彩,“春山学”吃透了,不如把目光移向OpenAI又一重磅产品——文生视频大模型Sora。智能新纪元已然开启,因为正如周鸿祎所说:“,Sora的诞生意味着AGI(通用人工智能)的实现将从10年缩短到1年。”

Sora模型之所以引起全球的关注,在于其可根据简短提示词,生成长达60s 高清短视频,将此前行业视频生成长度大幅提升。该模型实现了文生视频五大能力突破:

1、文本到视频,长时生成能力

Sora 能够根据用户提供的文本描述生成长达 60s 的视频,这此视频不仅保持了视觉品质,而且完整准确还原了用户的提示语。

来源于:OpenAI官网

2、复杂场景和角色生成能力

Sora 可以生成具有多个角色、特定的运动类型以及细节精准的主题与背景所构建的复杂场景。通过对生动角色以及复杂运镜的应用,视频具有高度真实性和叙事效果。我们认为对于短视频创作行业,制作者可以快速将创意进行视频化,并带来逼真的视觉效果。

来源于:OpenAI官网

3、深刻语言理解能力

Sora 对语言拥有深刻理解能力,可以准确解释提示并生成可以表达丰富情感引人注目的角色。我们认为 Sora 对语言的理解能力可以准确的反应用户的指令,从而创作出更加优质的作品。

来源于:OpenAI官网

4、多镜头生成能力

Sora 可以在单个生成的视频中创建多人镜头,同时可保持角色与视觉风格的一性。多镜头生成功能对于影视制作及其他多视角展示作品可起到极大辅助作用。

来源于:OpenAI官网

5、物理世界模拟能力

Sora 不仅可以理解用户在提示中输出的指令,还可以理解所生成的事物在物理世界存在与运行的方式,从而展现了人工智能在理解现实世界并与之互动的能力。Sora 可以模拟真实物理世界的运动,例如物体的移动、习性以及相互作用。

来源于:OpenAI官网

虽然有些人对OpenAI声称的Sora可以理解“物理规律”表示怀疑,但这个一分钟的视频所展示的效果,毫无疑问是人工智能的进一步取得。

从ChatGPT到Sora,AI正在加速普及。基于大模型的生成式 AI,快速衍生出一系列亲民值爆表的 AI 工具:文生图、文生视频、文生游戏、文生代码...聚焦软件开发领域,文生代码正在重塑软件开发关键节点,帮助开发人员提高工作效率。

以飞算SoFlu软件机器人推出的FuncGPT(慧函数)为例,作为一款专注AI生成Java函数的生成器,FuncGPT(慧函数)支持所有类型函数创建。通过自然语言描述Java函数需求,实时生成高质量、高可读性的Java函数代码。生成代码可直接复制到IDEA,或一键导入Java全自动开发工具函数库,帮助开发人员高效完成工作任务。

SoFlu软件机器人作为一款全栈式全自动的软件开发工具,覆盖软件前端开发、后端开发、测试、运维全过程,旨在改变原来手工编码的作业模式,通过可视化拖拽方式以及参数配置就能实现等同于编写复杂代码的业务逻辑,在设计业务逻辑的同时就完成了微服务应用开发,做到“业务即图,图即代码”,实现“软件开发,十倍提效”。

以某特大型央企石油集团旗下大型电商平台重构项目为例,传统模式下至少需要27人,开发300多天才能完成的项目,在使用了飞算SoFlu软件机器人后,9人小团队在5个软件机器人的协助下,仅用45天就完成了商城的重构及上线,并且在保障系统强壮度和安全性的同时从源头上降低系统维护难度。该项目负责人事后感叹,团队利用飞算SoFlu软件机器人实现了自主研发,做到了以前不可能完成的事情。

飞算SoFlu软件机器人搭载FuncGPT(慧函数),配以代码实时可见、人机交互智能等功能, 使得开发人员、企业得以体验人工智能带来的惊人变革。根据用户反馈,当作为生产工具使用时,AI的最大价值可能不仅仅是提高工作效率,而是帮助人们成为更全面的人才,使人们能够迅速掌握以往从未具备的技能。

毫无疑问,新技术并不会立刻产生效果,人们需要时间去学习如何有效地利用它。
1899年,汽车行业只有几千名从业者,每年仅生产出2500辆汽车。当微软电脑刚问世时,人们认为其销量不会超过一千台。在一档访谈节目中,主持人不以为然地说,电脑只是将收音机和电视机整合在一起,不知道有什么用处。


人工智能也是如此,即使是同一个智能机器人,我们会发现它展示出的能力是有差异的,智能机器人的表现取决于用户的知识水平、专业技能,以及提示词的应用能力。


我们相信,总有一天人工智能会像办公软件一样成为每个人日常生活中不可或缺的工具。至于它对人们的职业发展和社会进步会有怎样的影响,这还需要时间来揭示。目前可以确定的是,就像视频中展现的那位自信的女性一样,人工智能正在坚定地走进我们的生活。

相关文章:

  • spring boot3登录开发-3(账密登录逻辑实现)
  • 六、回归与聚类算法 - 模型保存与加载
  • TiDB 社区智慧合集丨TiDB 相关 SQL 脚本大全
  • 使用C#+NPOI进行Excel处理,实现多个Excel文件的求和统计
  • 每日leetcode--删除有序数组中的重复项
  • Node.JS入门(day01)
  • python3 flask 实现对config.yaml文件的内容的增删改查,并重启服务
  • 去重求和(最大N个数和最小N个数的和)(C 语言)
  • LINUX rpm离线包下载办法
  • 设计模式学习笔记 - 面向对象 - 6.为什么要基于接口而非实现编程?有必要为每个类都定义接口吗?
  • PD协议取电芯片:支持多协议小体积外围支持配置输出不同电压
  • 目标检测-Transformer-ViT和DETR
  • 备战蓝桥杯—— 双指针技巧巧答链表1
  • Leetcoder Day17| 二叉树 part06
  • 如何将实景三维倾斜模型叠加到三维地球上?
  • 【JavaScript】通过闭包创建具有私有属性的实例对象
  • E-HPC支持多队列管理和自动伸缩
  • IndexedDB
  • Java到底能干嘛?
  • log4j2输出到kafka
  • PHP的类修饰符与访问修饰符
  • Python 反序列化安全问题(二)
  • Quartz实现数据同步 | 从0开始构建SpringCloud微服务(3)
  • Spring Cloud Feign的两种使用姿势
  • 安装python包到指定虚拟环境
  • 分布式任务队列Celery
  • 工程优化暨babel升级小记
  • 前端技术周刊 2019-02-11 Serverless
  • 问:在指定的JSON数据中(最外层是数组)根据指定条件拿到匹配到的结果
  • 一些css基础学习笔记
  • 应用生命周期终极 DevOps 工具包
  • 源码安装memcached和php memcache扩展
  • ​软考-高级-信息系统项目管理师教程 第四版【第14章-项目沟通管理-思维导图】​
  • #微信小程序(布局、渲染层基础知识)
  • (1)(1.8) MSP(MultiWii 串行协议)(4.1 版)
  • (DenseNet)Densely Connected Convolutional Networks--Gao Huang
  • (ISPRS,2023)深度语义-视觉对齐用于zero-shot遥感图像场景分类
  • (Mac上)使用Python进行matplotlib 画图时,中文显示不出来
  • (react踩过的坑)antd 如何同时获取一个select 的value和 label值
  • (博弈 sg入门)kiki's game -- hdu -- 2147
  • (附源码)springboot 基于HTML5的个人网页的网站设计与实现 毕业设计 031623
  • (五)IO流之ByteArrayInput/OutputStream
  • (转)setTimeout 和 setInterval 的区别
  • .Net Core webapi RestFul 统一接口数据返回格式
  • .NET Core使用NPOI导出复杂,美观的Excel详解
  • .net 中viewstate的原理和使用
  • .NET版Word处理控件Aspose.words功能演示:在ASP.NET MVC中创建MS Word编辑器
  • /proc/vmstat 详解
  • @RequestMapping-占位符映射
  • @SuppressLint(NewApi)和@TargetApi()的区别
  • [ MSF使用实例 ] 利用永恒之蓝(MS17-010)漏洞导致windows靶机蓝屏并获取靶机权限
  • [autojs]autojs开关按钮的简单使用
  • [BZOJ] 2006: [NOI2010]超级钢琴
  • [C/C++] -- 二叉树
  • [corCTF 2022] CoRJail: From Null Byte Overflow To Docker Escape