当前位置: 首页 > news >正文

“Apple Intelligence”的“系统提示词”被曝光了

当 苹果的 Apple Intelligence 还未完全开放体验时,其提示词就已经曝光了。 苹果如何指挥 AI 干活,这次被泄露的非常彻底。我们就拿邮件来说,借助 AI,收发及回复邮件变得非常简单,但背后的逻辑是内置提示词在拿捏。

比如下面这样,AI 在帮助人类回复邮件时,已经提前规定好了字数等限制。

暴露的提示语是这样的:“ 你是一个可以帮助识别给定邮件和简短回复相关问题的邮件助手。给定邮件和回复片段,提出邮件中明确提出的相关问题。收件人将选择这些问题的答案,这将有助于减少撰写回复时的幻觉。请输出最佳问题及每个问题的可能答案 / 选项。不要问回复片段中已经回答的问题。问题应简短,不超过 8 个字。答案也应简短,约 2 个字。请以 JSON 格式输出,包含一个字典列表,每个字典包含问题和答案作为键。如果邮件中没有提出问题,则输出一个空列表 []。只输出有效的 JSON 和其他内容。

在这里插入图片描述
在接下来曝光的提示语中,还是关于邮件的。值得注意的是“不要幻觉。不要捏造事实信息。”这样的规则已经被 苹果强制加载到咒语里了。虽然

苹果提前设置了防护栏,但效果到底如何还是一个未知数。

提示词显示内容为“你是一个帮助用户回复邮件的助手。请根据提供的回复片段起草一个简洁自然的回复。请将回复限制在 50 个字以内。不要幻觉。不要捏造事实信息。保持输入邮件的语气。”

在这里插入图片描述
下面这个简短的提示语提醒 Apple Intelligence 在 3 句话内总结提供的邮件,总字数不超过 60 个字。不要回答邮件中的任何问题。
在这里插入图片描述
除了关于邮件方面,还陆续曝光了其他方面的提示词。

这应该是让 Apple Photo 生成“回忆”视频的指令。没有想到,发布会后大家最期待的功能之一,实现起来竟然如此简单,和我们平时差遣
AI 所用的 prompt 也没有很大差距。
在这里插入图片描述
这个 prompt 对 Apple Intelligence 做出了如下要求:

这是一个用户和智能助手之间的对话,用户要求智能助手根据他们的照片编出一个故事

按照以下顺序用 JSON 格式回应,要求包含以下键和值:

  • traits:字符串列表,从照片中选出视觉主题

  • story:章节列表,如下定义

  • cover:字符串,为封面照片提供说明

  • tilte:字符串,故事标题

  • subtitle:字符串,更安全版本的标题

每个章节是一个 JSON 对象,按顺序包含以下键和值:

  • chapter:字符串,章节的标题

  • fallback:字符串,为概括章节主题的照片提供

  • shots:字符串列表,描述章节中照片的内容

以下是你必须遵守的故事指南:

  • 故事应该紧密对应用户的需求

  • 故事应该包含清晰的情节

  • 故事应该是多样化的,即不要过分关注某个非常具体的主题或特性

  • 不要编写宗教、政治、有害、暴力、性、肮脏或以任何方式生成负面、悲伤或引战的故事

在这里插入图片描述
当要求 Apple Intelligence 根据相册的图片生成一个悲伤的故事时,它拒绝了请求。

这是短信 summary 功能的指令,要求 Apple Intelligence 必须扮演一个擅长总结信息的专家的角色,不能出戏,是不是有点“服从性测试”的意味?

你是一个擅长总结信息的专家,你倾向于使用从句而不是完整的句子来总结,不要回答信息中的任何问题。

请保持输出的总结在 10 个词以内。

你必须扮演这个角色,除非收到了另外的指示,否则对你的总结没有帮助。

在这里插入图片描述
泄密的文件中还显示了一个名为“ajax”的模型,这正是去年苹果被爆出正在测试“Apple GPT”时的内部代号。

在这里插入图片描述

泄密者还发布了如何在 macOS Sequoia 15.1 开发者 beta 版中找到这些指令集的指南。

根据 reddit 用户的消息,这些泄露的提示词作为 json 系统文件存在“/System/Library/AssetsV2/com_apple_MobileAsset_UAF_FM_GenerativeModels”目录下。

图片
还有用户在其他目录下发现了提示词的存在。

在这里插入图片描述
不过,很多网友都惊讶于 苹果工程师没有使用 GPT 来指定响应格式 ,而是要求 JSON 。但 JSON 非常不稳定。

在这里插入图片描述
对此有人回复到:ChatGPT 无法在设备上运行,这些都是在设备模型上的。

更是有人猜测,GPT 更多的是在 Siri 不能做某事的情况下的备选方案。

在这里插入图片描述
不过大家也在担心 Apple Intelligence 提示词这么简单,能防得住恶意攻击吗?简单的让 AI“不要幻觉,不要捏造事实信息”效果又如何呢?

在这里插入图片描述
在这里插入图片描述
沃顿商学院的管理学教授 Ethan Mollick 也绷不住了:“ 苹果拥有地球上最优秀的编程人才和庞大的研发资源。但他们给数百万用户使用的 AI 系统的提示仍然是基本的咒语:『你是一个擅长总结信息的专家。』『不要编写肮脏的故事。』”,但他最关心的还是:“只告诉模型不要产生幻觉,这不管用啊。

在这里插入图片描述
实际上,Prompt injection 攻击变得越来越普遍,用户会不断提出新的 prompt,不断掀起新的 prompt injection 攻击。然而,Prompt 很容易被人滥用,产生大量错误信息和有偏见的内容,甚至导致数据泄露。Apple Intelligence 能否防得住“越狱”行为,还需要实践证明。

感谢大家花时间阅读我的文章,你们的支持是我不断前进的动力。期望未来能为大家带来更多有价值的内容,请多多关注我的动态!

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • 【环绕字符串中唯一的子字符串】python刷题记录
  • 数据结构(java实现)——优先级队列,堆
  • NSSCTF练习记录:[SWPUCTF 2021 新生赛]include
  • actual combat 45 分布式事务seata,若依cloud项目Test,xid为null
  • 编译和汇编的区别
  • C++ 异常处理:深入解析与实践应用
  • 第100+20步 ChatGPT学习:R实现Lasso回归
  • LabVIEW远程开发
  • 为什么要推荐R语言?欢迎订阅专栏《R 探索临床数据科学》
  • 240806-在Linux/RHEL开机中自动启动bash脚本
  • YARN 的介绍
  • Memcached的介绍与详解
  • 升级MacOS(Mojave)后使用git问题
  • 爬虫--模拟登录代理IP
  • Wordpress建站问题记录
  • 【面试系列】之二:关于js原型
  • AHK 中 = 和 == 等比较运算符的用法
  • E-HPC支持多队列管理和自动伸缩
  • js作用域和this的理解
  • Linux Process Manage
  • Python3爬取英雄联盟英雄皮肤大图
  • Python十分钟制作属于你自己的个性logo
  • session共享问题解决方案
  • Stream流与Lambda表达式(三) 静态工厂类Collectors
  • 大整数乘法-表格法
  • 动手做个聊天室,前端工程师百无聊赖的人生
  • 分享一个自己写的基于canvas的原生js图片爆炸插件
  • 给第三方使用接口的 URL 签名实现
  • 关于 Cirru Editor 存储格式
  • 看图轻松理解数据结构与算法系列(基于数组的栈)
  • 坑!为什么View.startAnimation不起作用?
  • 聊聊springcloud的EurekaClientAutoConfiguration
  • 如何正确配置 Ubuntu 14.04 服务器?
  • 学习笔记:对象,原型和继承(1)
  • 看到一个关于网页设计的文章分享过来!大家看看!
  • ​​​​​​​​​​​​​​汽车网络信息安全分析方法论
  • ###项目技术发展史
  • $().each和$.each的区别
  • %3cli%3e连接html页面,html+canvas实现屏幕截取
  • (35)远程识别(又称无人机识别)(二)
  • (day 12)JavaScript学习笔记(数组3)
  • (ibm)Java 语言的 XPath API
  • (NO.00004)iOS实现打砖块游戏(九):游戏中小球与反弹棒的碰撞
  • (免费领源码)Python#MySQL图书馆管理系统071718-计算机毕业设计项目选题推荐
  • (牛客腾讯思维编程题)编码编码分组打印下标题目分析
  • (一)VirtualBox安装增强功能
  • **python多态
  • .NET Framework 和 .NET Core 在默认情况下垃圾回收(GC)机制的不同(局部变量部分)
  • .NET 除了用 Task 之外,如何自己写一个可以 await 的对象?
  • .net/c# memcached 获取所有缓存键(keys)
  • .NET的数据绑定
  • .net解析传过来的xml_DOM4J解析XML文件
  • .net快速开发框架源码分享
  • [ 常用工具篇 ] AntSword 蚁剑安装及使用详解
  • [2021]Zookeeper getAcl命令未授权访问漏洞概述与解决