当前位置: 首页 > news >正文

黑神画Ⅱ--Unix 是下一代人工智能的模板吗?

有一张图被用来描述 GPT5 比 GPT4 大多少,GPT3 被描绘成一条大白鲨,GPT4 被描绘成一条虎鲸,然后 GPT5 被描绘成一条座头鲸,这表明它们训练的数据量大幅增加。

这是一个有趣的类比,因为它传达了规模的概念,但当你思考这些类比代表什么时,它就更加有趣了。GPT3 是鱼类世界中的顶级捕食者,这种生物数百万年来都不需要进化,因为它在工作中表现出色,事实上它有一个真正的敌人:海豚家族的成员,尤其是虎鲸。与此同时,座头鲸以磷虾为食,有时也会成为虎鲸的牺牲品。

在技​​术领域,我们以前就见过这样的战斗,这场战斗始于 VMS 之类的系统,后来演变为 Windows NT,最后总算有一个架构胜出:Unix。Unix 的理念很简单,即创建解决特定问题的单独工具,并提供一种机制将它们串联在一起。


在应届毕业生面前,我表现得聪明的一个方法是打开 Mac 并运行一个命令行脚本,该脚本可以在几秒钟内完成他们原本计划编写大量代码甚至手动完成的任务。有人对我说“我可以用 Python 做到这一点”,这是真的,但 find、grep 和 awk/sed 的强大功能对大多数人来说就像魔术一样。正是这种强大功能让 Linux 在服务器端赢得了胜利,它是 MacOS 的基础功能,甚至如今的 Windows 也渴望拥有这种强大功能。

这也不是一场一次性的战斗。分布式系统、SOA、REST 等的兴起是对大型机时代无法维护的单片系统的反应,这些新方法将系统分解为可以独立开发和扩展的单个部分。Docker 和 Kubernetes 等技术建立在虚拟化的基础上,为部署提供了相同的理念。在数据方面,我们从天上神话般的巨型数据库(每个人都遵循单一模式)转变为分布式数据网格,业务的每个领域都可以对自己的数据有自己的看法,引入他们需要的内容并通过发布结果进行协作。

在处理器领域,我们看到以最高 GHz 运行的大型单核处理器的想法被多核多用途解决方案所取代,这些解决方案具有用于不同目的的不同内核。即使是软件包供应商(当今集中化的堡垒之一)也旨在解构其解决方案并实现更多联合部署和配置,尽管并不总是成功,但意图是存在的。


因此,在技术领域,单体和联合之间的斗争已经持续了很久,而获胜者几乎无一例外都是联合和专业化,即“做好一件事”然后合作以取得成果的理念。即使集中化和单体在某种程度上取得了胜利,它们也只在非常特定的领域获胜。

制作大量小模型或意向应用程序?

其中一个优点是,对于边缘设备和低功率设备,Unix 一直非常擅长适应外形尺寸。Raspberry PI 有多个下载选项,其中最小的是 500MB,这是有原因的,但与你自己调整相比,这太大了,你可以花很多功夫把它降到 10MB 以下。

我们会开始在基础模型中看到这一点吗?不仅通过Llama3.1之类的模型获得“小(但很大)”、“中等(但巨大)”和“绝对庞大(同意)” ,而且能够通过微调或其他技术创建更小、更专用的模型?我现在在构建解决方案时,我倾向于这样做,但没有小模型的好处,所以我实际上有一个更大的模型,我以 5 种不同的方式使用它,这仍然只利用了其一小部分功能,但在功率和性能方面都付出了巨大的代价

随着模型部署到手机等边缘设备,我们将看到这一挑战日益严峻,保护隐私、消除网络延迟,但肯定无法运行 4500 亿或 2 万亿参数的模型。

“意图” 是新“事物”吗?

苹果在Apple Intelligence中采用的“意图”新方法为我们提供了一个有趣的不同想法,即应用程序如何专注于任务但仍然利用模型的功能,以及不同的应用程序如何通过该界面相互利用。该模型明确专注于实现跨应用程序协作而不是单个应用程序协作,即使它可能全部由单个平台优化模型支持。因此,您可能拥有视频处理应用程序、社交媒体应用程序、生成图像应用程序和摄像头,并且能够使用编排命令或其他应用程序将它们组合在一起,因此即使您更改生成图像应用程序,解决方案仍然有效,因为意图保持不变。这还处于早期阶段,但它代表了一种构建协作式 AI 应用程序的新方法。

它会是桌面上的 Linux 吗?

IT 界流传最久的一个笑话是“今年是 Linux 桌面年”,因为尽管 Linux 在服务器上取得了巨大成功,但在桌面上却一败涂地。这一切都意味着单一模型方法可能是未来,但我对此表示怀疑。我只是认为我们需要“大小合适”的人工智能,我们可以像人一样管理它们,它们能够明确定义自己的目的并参与协作。

做好一件事比尝试用一种方法做好所有事情要容易得多。

即使是锤子也可以专门做一件事——它并不总是用来敲钉子

​​欢迎前往我们的公众号,资讯​​​​​​

创作不易,觉得不错的话,点个赞吧!!!

相关文章:

  • 北京网站建设多少钱?
  • 辽宁网页制作哪家好_网站建设
  • 高端品牌网站建设_汉中网站制作
  • ios 5.5寸、ipad13英寸如何截屏
  • 网络安全-渗透测试工具及插件介绍和使用方法
  • RabbitMQ:发送者的可靠性之配置发送者重试机制
  • 在 Linux 系统中下载 Python 并配置环境
  • 使用GPT-4o mini融合GraphRAG技术进行实战应用
  • 鸿蒙媒体开发【拼图】拍照和图片
  • Flask数据库操作(第四阶段)
  • CLM安装及运行、移植、编译、结果处理、可视化;CESM移植、安装及快速运行
  • 【JavaEE】定时器
  • MySQL基础操作指南:从连接到数据管理的完整指南
  • Excel表列名称
  • React类组件与函数组件有什么异同
  • Linux IPC-管道
  • 探索AI与社交的交汇点:看Facebook如何引领智能化革命
  • SSM伊犁旅游攻略网站—计算机毕业设计源码15961
  • 《Javascript数据结构和算法》笔记-「字典和散列表」
  • 【每日笔记】【Go学习笔记】2019-01-10 codis proxy处理流程
  • download使用浅析
  • httpie使用详解
  • Java 多线程编程之:notify 和 wait 用法
  • java8-模拟hadoop
  • Java精华积累:初学者都应该搞懂的问题
  • Mac转Windows的拯救指南
  • mysql外键的使用
  • vue脚手架vue-cli
  • Webpack入门之遇到的那些坑,系列示例Demo
  • 浮现式设计
  • 前端每日实战 2018 年 7 月份项目汇总(共 29 个项目)
  • 如何选择开源的机器学习框架?
  • 少走弯路,给Java 1~5 年程序员的建议
  • 详解NodeJs流之一
  • mysql面试题分组并合并列
  • 阿里云服务器如何修改远程端口?
  • ​DB-Engines 12月数据库排名: PostgreSQL有望获得「2020年度数据库」荣誉?
  • ​RecSys 2022 | 面向人岗匹配的双向选择偏好建模
  • ######## golang各章节终篇索引 ########
  • #stm32驱动外设模块总结w5500模块
  • #我与Java虚拟机的故事#连载03:面试过的百度,滴滴,快手都问了这些问题
  • #职场发展#其他
  • (C语言)字符分类函数
  • (ibm)Java 语言的 XPath API
  • (Java入门)学生管理系统
  • (Java实习生)每日10道面试题打卡——JavaWeb篇
  • (Oracle)SQL优化技巧(一):分页查询
  • (web自动化测试+python)1
  • (转)mysql使用Navicat 导出和导入数据库
  • (最优化理论与方法)第二章最优化所需基础知识-第三节:重要凸集举例
  • *p=a是把a的值赋给p,p=a是把a的地址赋给p。
  • .NET Core/Framework 创建委托以大幅度提高反射调用的性能
  • .NET Core中如何集成RabbitMQ
  • .net 受管制代码
  • .net6Api后台+uniapp导出Excel
  • .net实现客户区延伸至至非客户区
  • .Net转前端开发-启航篇,如何定制博客园主题
  • @RequestParam,@RequestBody和@PathVariable 区别