当前位置: 首页 > news >正文

2024 Sora来了!“手机Agent智能体”也来了!

近日,Open AI发布了能够根据文本生成超现实视频的工具Sora,多款震撼视频引爆科技圈刷屏,热度持续发酵占据AI领域话题中心,被认为是AGI实现过程里的重大里程碑事件。新一轮的人工智能浪潮给人类未来的生产和生活方式带来巨大而深远的影响,同时基于大模型的Agent智能体正在颠覆我们的未来。

23年8月,实在智能就已推出全球首款将计算机视觉、TARS大模型与RPA深度融合的落地产品——实在Agent智能体,实现你说,PC做。如今,实在智能又全新升级:手机Agent智能体已经会“玩”手机了!通过自主学习和模仿人类的点击和滑动手势,可以在手机上操作App执行各种任务。

实在Agent智能体(手机Agent)

从“你说PC做,所说即所得”人机协同办公的个人PC数字助理,到实现“你说,手机做”的超级手机助理,只需一句话直接传达自己的意图,就可以帮你操作所有电脑、手机的软件完成各类工作和生活的目标任务,从而不需要手动操作,我们正在迈向一个每个人都拥有多个AI Agent的时代。

AI Agent(人工智能助理),是一种可以实现自主理解、长期记忆、规划决策、执行复杂任务的智能体,正在探索AGI的道路上快速前进,成为人工智能应用的重要方向之一,比尔·盖茨为此重磅发文,非常值得一起来分享一下Agent智能体以及在电脑和手机工作的原理。

实在智能推出“手机+Agent”结合的手机智能体,可以打破手机App的界限,跨应用操作任何手机软件完成任务,与传统的Siri不同的是,手机智能体不是简单的命令执行者,而是规划、决策和执行的多面手,通过ISSUT(智能屏幕语义理解技术)视觉能力进行整个操纵过程,无侵入接口,也不需要系统后台访问用户的隐私、敏感数据来实现操作。

实在Agent智能体(手机Agent)

例如,春节开工期间,您正忙于工作,无暇分身向客户发送开工问候,类似于此的重复性工作,在手机智能体的帮助下就可以自动完成,您只需对手机说出“向标签为客户的好友发送开工问候”的需求,它就可以识别您的微信标签备注,向该标签下所有客户发送专属问候语,成为你的手机办公助理。

手机Agent能够通过模仿人类的直观动作来与手机应用程序交互,就像一个真人用户一样,可以查询天气定机票、预约餐厅订位、进行在线购物、编辑图片或制作视频,也可以操作办公软件发送邮件、采集业务数据和处理表格、提交工作流程审批单等等,只需一个指令,手机Agent智能体在瞬息间即可帮你完成。

实在智能推出的手机Agent智能体,验证了AI Agent的实用性,在移动Agent领域做出了一个很好的应用示范,其未来有更多创新的多模态框架探索,我们可以期待未来手机Agent智能体在提高工作效率、改善生活方式、辅助日常生活等多个方面的应用,将对商业、个人产生深远影响。

相关文章:

  • MyBatis Plus:自定义typeHandler类型处理器
  • Autodesk CAD如何建立图层方框?
  • Python学习笔记——PySide6设计GUI应用之UI与逻辑分离
  • git中将所有修改的文件上传到暂存区
  • 探索最新AI视频生成技术——OpenAI Sora模型的机遇和挑战
  • websoket
  • CTR之行为序列建模用户兴趣:DIN
  • 用于将Grafana默认数据库sqlite3迁移到MySQL数据库
  • 如何用GPT进行成像光谱遥感数据处理?
  • HarmonyOS Stage模型 权限申请
  • 论文阅读:How Do Neural Networks See Depth in Single Images?
  • SQLite 的使用
  • 《最新出炉》系列初窥篇-Python+Playwright自动化测试-19-处理鼠标拖拽-中篇
  • 一款跳转警告HTML单页模板源码
  • MySQL 窗口函数温故知新
  • JavaScript-如何实现克隆(clone)函数
  • (三)从jvm层面了解线程的启动和停止
  • 【108天】Java——《Head First Java》笔记(第1-4章)
  • 【402天】跃迁之路——程序员高效学习方法论探索系列(实验阶段159-2018.03.14)...
  • Android 控件背景颜色处理
  • ComponentOne 2017 V2版本正式发布
  • gops —— Go 程序诊断分析工具
  • js如何打印object对象
  • js中的正则表达式入门
  • Material Design
  • MYSQL 的 IF 函数
  • PHP的Ev教程三(Periodic watcher)
  • Sass 快速入门教程
  • vue自定义指令实现v-tap插件
  • weex踩坑之旅第一弹 ~ 搭建具有入口文件的weex脚手架
  • 翻译:Hystrix - How To Use
  • 关于 Linux 进程的 UID、EUID、GID 和 EGID
  • 基于Volley网络库实现加载多种网络图片(包括GIF动态图片、圆形图片、普通图片)...
  • 基于组件的设计工作流与界面抽象
  • 理解 C# 泛型接口中的协变与逆变(抗变)
  • 目录与文件属性:编写ls
  • 普通函数和构造函数的区别
  • 用简单代码看卷积组块发展
  • 再谈express与koa的对比
  • 找一份好的前端工作,起点很重要
  • 主流的CSS水平和垂直居中技术大全
  • 3月27日云栖精选夜读 | 从 “城市大脑”实践,瞭望未来城市源起 ...
  • SAP CRM里Lead通过工作流自动创建Opportunity的原理讲解 ...
  • 宾利慕尚创始人典藏版国内首秀,2025年前实现全系车型电动化 | 2019上海车展 ...
  • 带你开发类似Pokemon Go的AR游戏
  • # Apache SeaTunnel 究竟是什么?
  • # Java NIO(一)FileChannel
  • (4)事件处理——(6)给.ready()回调函数传递一个参数(Passing an argument to the .ready() callback)...
  • (BFS)hdoj2377-Bus Pass
  • (delphi11最新学习资料) Object Pascal 学习笔记---第8章第5节(封闭类和Final方法)
  • (javascript)再说document.body.scrollTop的使用问题
  • (MIT博士)林达华老师-概率模型与计算机视觉”
  • (ZT)薛涌:谈贫说富
  • (动手学习深度学习)第13章 计算机视觉---微调
  • (剑指Offer)面试题41:和为s的连续正数序列