当前位置: 首页 > news >正文

苹果WWDC 2024或将推出AI生成的表情符号并宣布与OpenAI的合作|TodayAI

苹果正在为即将到来的WWDC(全球开发者大会)做准备,并将展示其生成式AI技术。根据Mark Gurman在Bloomberg的《Power On》通讯中的报道,苹果将在2024年的WWDC上讲述自己的AI故事,但这可能不会像Google、Microsoft或OpenAI展示的那样具有炫目的功能。

Gurman指出,苹果此次活动可能会推出一些基础的AI功能,例如转录语音备忘录或自动生成的表情符号。同时,苹果还将宣布与OpenAI的传闻中的合作伙伴关系。最近的传闻称,苹果将允许聊天机器人更深入地集成到其操作系统中,而OpenAI的ChatGPT将率先实现这一点。据Gurman透露,苹果正在与Google就类似的集成进行谈判,涉及Google的Gemini。此外,苹果也被传闻正在与Anthropic进行谈判,这些谈判始于OpenAI的“斯嘉丽·约翰逊事件”之前,强调了苹果可能需要不止一个iPhone聊天机器人合作伙伴的原因。

无论这些潜在合作伙伴关系意味着什么,苹果的AI方法显然将专注于实用性。Gurman提到,苹果可能会宣布一个显著的改进——“智能摘要”功能。这项功能将总结错过的短信、通知以及其他如网页、新闻文章、文档、笔记和其他形式的媒体内容。这在处理iOS通知时可能特别有用,因为通知可能会让人感到不堪重负且难以管理。如果仔细观察,这与Microsoft最近宣布的Recall功能略有相似,后者允许用户回顾在计算机上所做的事情。

此外,语音备忘录应用程序也可能会大幅提升AI生成的转录功能。Gurman指出,这对于回顾采访录音是关键,但也可能对学生录制课程以供日后参考非常有用。苹果设备已经有类似的功能,如自动生成的语音邮件转录和视频、音频以及对话的系统级字幕。

据报道,苹果还计划宣布AI驱动的设备内Spotlight搜索改进、Safari的互联网搜索,以及电子邮件和短信的写作建议。公司还可能使用AI来润饰照片并根据用户的短信即时生成表情符号,这类功能似乎总是会给这些公司带来麻烦。例如,Meta的持枪Waluigi AI贴纸或Google的不适当种族多样化的纳粹图片。

Gurman还提到,苹果可能会展示基于自家大型语言模型的更好、更自然的Siri语音,以及在Apple Watch上改进的Siri功能。在可能的情况下,苹果设备将本地完成所有这些工作,但对于复杂任务,它们会将处理转移到苹果自家的基于M2 Ultra的服务器上。总体而言,Gurman表示“在过去一年左右发布的设备”将获得大多数新的设备内AI功能。

除了AI功能外,Gurman称,苹果公司还可能会宣布一个iOS 18功能,允许用户将应用图标更改为不同颜色。目前可以通过iOS的快捷方式应用实现类似功能,但用户可能更欢迎一种更直接的方法。这一功能将是除了即将传闻中的iPhone主屏幕变化之外的又一改进,允许用户随意放置应用图标,而不是iOS强制的自上而下、从左到右的排列。未来可能还会出现更多的定制启动器。

苹果的全球开发者大会(WWDC)将于6月10日开幕,届时通常会发布iPhone和其他产品的新软件更新。无论苹果计划如何将更多AI功能引入iPhone,我们很可能会在那时听到相关消息。只有苹果知道iPhone及其其他产品的未来。但与此同时,这里有一些我们现在在新款iPhone上最喜欢的基于AI的功能。


 

数字化复制你的声音

苹果可能没有聊天机器人,但它已经在去年随iOS 17推出的一个功能中使用了AI。个人语音(Personal Voice)是一个辅助功能设置,使用设备内的机器学习,允许有语言丧失风险的人复制他们的声音,以便更容易与亲人沟通。为了学习你的声音,iPhone会要求你朗读150个短语。然后它使用AI分析你的声音并生成一个合成版本。要使用这种新合成的声音进行交流,你可以使用iPhone的文字转语音工具,将文本转换为语音,在FaceTime和第三方兼容应用中使用。如果你有兴趣了解如何在iPhone上克隆和存储你的声音,这里有一个分步指南。

轻松从iPhone图片中复制文本

实况文本(Live Text)是一个已经在运行iOS 15或更高版本的iPhone上可用的前端AI功能。这是一个计算机视觉工具,可以识别照片中的手写和打印文本,就像Google Lens一样。然后,可以通过简单的点击将图片中的文本复制和粘贴。实况文本在日常生活中常常派上用场。比如,你有一个手写的食谱想要数字化。在用iPhone拍摄该食谱的照片后,你可以将该文本复制并粘贴到Word文档中,作为数字备份。这里有一个详细的分步指南,教你如何做到这一点。竞争对手的手机制造商也加入了这个行列。Honor的Magic 6 Pro和Magic V2,它们运行公司的Magic OS 8软件,引入了具有类似功能的Magic Text功能。

改进的自动纠错

通过最新的软件更新,苹果还解决了一个最大的自动纠错问题。现在你可以轻松地使用脏话,而不会被苹果自动更改为诸如“duck”或“shut”之类的更温和的词。除了允许你轻松使用脏话外,自动纠错在更广泛的层面上也得到了改进。自动纠错现在可以更准确地修正错误,并提供更多定制的内联预测文本。苹果将这一改进归功于iOS 17的新变压器语言模型,该模型使用机器学习进行词语预测。它通过大量数据训练,能够学习上下文和模式,从而提供改进的结果,或者在这种情况下,能够复制人类的语音风格。

摄影智能

众所周知,iPhone依赖先进的算法以及计算摄影来实现大量相机功能。人像模式使用AI识别主体并创建散景效果,这是一个例子。另一个例子是电影效果模式,它使用AI模拟所需的光圈并动态调整焦点,以保持移动主体的清晰。iOS 17带来的新AI驱动功能之一是照片应用能够识别照片中的宠物,从而实现更好的照片组织。

未来的iPhone AI:Siri会变得更智能吗?

Siri自2011年以来一直存在,但即使它是市场上的第一个虚拟助手,也未能跟上竞争对手的步伐。然而,苹果的语音激活助手可能很快会变得更智能。据《信息报》9月的一份报告称,苹果计划使用大型语言模型(生成式AI的关键部分)来增强Siri。该文章中提到的一个例子解释了Siri如何能够响应简单的语音命令来完成更复杂的任务,例如将一组照片转换为GIF并发送给你的一个联系人。如果这一例子准确无误,这将代表苹果数字助手的一个重大进步。苹果已经使用AI来帮助Siri理解语言并以人类方式回应等,但它在处理上下文方面仍然存在困难。

 

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • vue小记——上传图片小组件
  • 51单片机的最小系统详解
  • 全球点赞最高的人颜廷利:真正的人生目标是什么
  • win11安装MySQL
  • sqlites数据库读取,仅适用于数据少的数据库查询
  • Facebook:打开数字社交的魔盒
  • ARM day5
  • 6-5 统计二叉树结点个数
  • 【第八章】多线程——Thread类
  • 微信小程序如何跳转微信公众号
  • 苹果手机备忘录共享到微信,为何显示不支持的类型
  • 冷冻式压缩空气干燥机常见几种系统原理图
  • Vue从入门到实战Day07
  • HTML蓝色爱心
  • C++第二十弹---深入理解STL中vector的使用
  • 【comparator, comparable】小总结
  • DataBase in Android
  • ES6系列(二)变量的解构赋值
  • Fabric架构演变之路
  • Git学习与使用心得(1)—— 初始化
  • Idea+maven+scala构建包并在spark on yarn 运行
  • Invalidate和postInvalidate的区别
  • JSONP原理
  • PHP的Ev教程三(Periodic watcher)
  • PHP那些事儿
  • python_bomb----数据类型总结
  • unity如何实现一个固定宽度的orthagraphic相机
  • 大型网站性能监测、分析与优化常见问题QA
  • 浅谈web中前端模板引擎的使用
  • 线性表及其算法(java实现)
  • 用element的upload组件实现多图片上传和压缩
  • Unity3D - 异步加载游戏场景与异步加载游戏资源进度条 ...
  • 阿里云移动端播放器高级功能介绍
  • 蚂蚁金服CTO程立:真正的技术革命才刚刚开始
  • # Pytorch 中可以直接调用的Loss Functions总结:
  • #职场发展#其他
  • %check_box% in rails :coditions={:has_many , :through}
  • (2)STL算法之元素计数
  • (javaweb)Http协议
  • (代码示例)使用setTimeout来延迟加载JS脚本文件
  • (二)【Jmeter】专栏实战项目靶场drupal部署
  • (附源码)spring boot网络空间安全实验教学示范中心网站 毕业设计 111454
  • (九)信息融合方式简介
  • (十二)devops持续集成开发——jenkins的全局工具配置之sonar qube环境安装及配置
  • (十三)Flink SQL
  • (新)网络工程师考点串讲与真题详解
  • (转)Scala的“=”符号简介
  • (转)关于如何学好游戏3D引擎编程的一些经验
  • (转)使用VMware vSphere标准交换机设置网络连接
  • .Net Core 生成管理员权限的应用程序
  • .NET Micro Framework 4.2 beta 源码探析
  • .net 流——流的类型体系简单介绍
  • .netcore 6.0/7.0项目迁移至.netcore 8.0 注意事项
  • [23] 4K4D: Real-Time 4D View Synthesis at 4K Resolution
  • [C++]运行时,如何确保一个对象是只读的