当前位置: 首页 > news >正文

AI 芯片,是金山还是泡沫?

忽如一夜春风来,千树万树梨花开。随着 AI 产业的迅速发展,越来越多的企业都投身到了 AI 淘金这股浪潮中,而其中最为耀眼的便是 AI

 

忽如一夜春风来,千树万树梨花开。随着 AI 产业的迅速发展,越来越多的企业都投身到了 AI 淘金这股浪潮中,而其中最为耀眼的便是 AI 芯片。

aixinp.jpg

2016 年 5 月,谷歌发布自主设计芯片 TPU(张量处理器),同年英特尔也发布 Nervana AI 处理器,去年,Deep Mind 投资的 Graphcore 公司也推出了 IPU 智能处理器;而就在国外企业纷纷研发 AI 芯片的同时,国内企业也同样没有闲着:在寒武纪推出神经网络处理器 NPU(今年其又被重命名为机器学习处理器 MLU)之际,深鉴科技则做了一款基于 FPGA 平台的 DPU(深度学习处理器),就连地平线也推出了嵌入式大脑处理器(BPU)……

为什么会突然出现这么多 CPU、GPU 的兄弟?

众所周知,目前业内最为人所知、应用范围最广的芯片是 CPU 和 GPU。

其中,CPU 出现的历史最长,在电子设备中的作用也最为重要,但由于其仅用于串行计算,所以在需要海量计算的 AI 场景下,其数据处理能力已显然不够,而且雪上加霜的是,处理器的性能每 18 个月就能翻倍的摩尔定律也已几近失效,想要依靠摩尔定律提升 CPU 的性能已经不太现实。

而就在此时,因为具有并行计算能力而拥有更强运算力的 GPU 开始被人们重视,并被广泛用于人工智能领域。从此,人工智能有了 GPU 在算力方面的支持,人工智能也迅速进入应用阶段。甚至有人表示, 没有 GPU,就没有这一波 AI 浪潮。

而 GPU 领域的绝对霸主英伟达也因此扶摇直上,成为了当今人工智能领域最为成功的企业:2015 年,英伟达的市值是 100 亿美元,而目前其股价已暴涨至 1300 亿美元。

然而,GPU 虽然帮助人工智能走过了蹒跚学步的初级阶段,但人工智能接下来的要走的路却不一定适合由 GPU 来走了。

  • 首先在云端,数据中心最大的成本支出一般都是电力成本,因此,能耗压力是迫使 GPU 让位的重要原因。比如,根据谷歌去年 4 月曝光的数据,当时,TPU 已经在谷歌数据中心内部使用大约两年,并依靠 TPU 打败了李世石。(根据谷歌的一份论文显示 TPU 平均比 Nvidia K80 GPU 或 Haswell CPU 快 15~30 倍,性能功耗比高出约 30~80 倍,不过英伟达对此反驳,认为谷歌是在拿 TPU 和旧的 GPU 进行比较,因此不客观。不过必须了解到的是,一般而言芯片功耗越高性能越强,因此,拿功耗高出很多的 GPU 与相对低功耗的 TPU 相比较,其实也不公平)。

  • 其次便是在终端,随着用户越来越关心个人隐私安全与时效性,此前以云端为基础的人工智能正逐渐部分或完全被终端智能所取代。而终端智能则要求芯片同时具备高性能与低功耗的特征。

虽然 GPU 在处理很多人工智能问题时已经很高效了,而且 GPU 作为通用芯片可以适应各种不同的应用场景,但 GPU 在运行不同场景中的程序时,芯片的整体性能其实是很难完全发挥出来。其实也可以说,没有任何单一的 AI 系统能够在任何场景完美地工作。因此,AI 在不同场景中的应用,都需要针对场景的需求,在功耗、延迟、数据吞吐量、加速器方案的选择上做出调整和优化,使其能够完美运行适应特定应用场景的算法——于是,各种 CPU、GPU 的兄弟便诞生了。

另外,地平线算法 VP 黄畅还表示即使是在同一细分应用场景下,只要深入行业,就会发现算法依然会有所不同。而这便意味着市场需要更多种类的 AI 芯片。

总的来说,AI 芯片在此时出现是顺应时代发展趋势的。

技术与落地,决定 AI 芯片生死的关键

虽然目前市面上各种 X-PU 都因赶上了 AI 风口而欣喜不已,然而,今天拥挤在身边的是“兄弟”,在明天就可能是敌人了,想想 CPU、GPU 目前的寡头天下不就是活生生的例子吗?X-PU 们真都能笑到最后吗?这也是很多入局者都关心的一个问题。

OnceAI 创始人张春亮坚信 AI 芯片行业不太可能出现一两家企业统治全部 AI 芯片的情况。“比如现在的通信市场,有追求高性能高速率的 5G 标准,但其也必然再来高功耗(的问题)。所以小数据量传输但低功耗的窄带需求量也越来越大。而且还有像 wifi、蓝牙、红外之类的不同场景间的传输协议。”张春亮在知乎上回应认为市场非常大,而且市场需求也不可能统一,因此,“AI 芯片以后很有可能深化出像 PIC/AVR 这样的低功耗低计算力的芯片,还有像 Intel/amd 这样的高计算能力高功耗的芯片,或者像 arm 适用于移动场景的芯片。”

“AI 和任何一个新兴的技术都一样,引起市场广泛关注的时候都会有很多大佬以及创业公司进入到这个市场,然后开始做芯片。我其实觉得这是一件有趣的事情,因为只有这么多的公司从不同的角度去看待技术,去研发他们的技术,才能给市场带来真正的变革,然后才能把这些技术真正的落地。”英特尔新技术业务 Movidius 产品业务拓展负责人 Gordon 虽然很认可当前 AI 芯片的大量崛起,但这并不意味着现在所有但 AI 芯片企业都能活到最后,AI 芯片行业跟其他行业一样,也都将有一个优胜劣汰的过程:

  • 首先,做 AI 芯片的技术难度不小。“怎么把合理的架构和应用场景结合起来,把芯片的性能、功耗和使用场景结合起来,做出一个非常好的产品,这实际上对每个企业都是巨大的挑战。” 为了说明这一点,Gordon 还透露了一个他的经验:很多企业可能买了很多 IP,以为把它组在一起就能达到好的性能,但实际上这些产品并不一定能有市场。

  • 其次,也是最关键的,那就是市场化与产品落地。Gordon 就强调落地是一个“非常重要”的事情。Gordon 认为做芯片在技术上虽然有难度,但只要找到合适的人,其实也会有很多人都能做,但创业的本质并不是要做出一款技术上的好产品,而是要解决行业特定问题,从而赚钱养活自己。“而这里的问题就是你对产品的开发到底有多深的理解,一个是架构,一个是平衡,如何在性能、功耗、延迟等方面做好取舍,再一个就是对市场的理解,决定做那个行业等。”

而该观点也得到了黄畅的认同,“只是做芯片是远远不够的,关键还是应用的落地,所以地平线是把算法和芯片结合在一起迭代优化,针对应用场景全程推动落地。”黄畅如此表示。

给国内 AI 芯片创业公司的建议

Gordon 表示,英特尔其实是众多 AI 芯片创业公司的巨大竞争对手,“我们虽然进来的晚,但我们在芯片领域有着多年的研究,慢只是慢在软件以及与场景的结合上。”Gordon 认为英特尔一个重要优势便是与行业有着非常紧密的结合,因此,Gordon 认为英特尔想要后来者居上其实也并非不可能。

不过,面对巨头,中小 AI 芯片创业公司也并非没有成功的可能性。目前,市面上有一个观点就是像英特尔这样的大企业因为精力有限,无法覆盖所有的细分场景,因此,小企业便有了得以生存的夹缝。

而该观点也得到了 Gordon 的证实:虽然英特尔非常看重垂直,但英特尔也会评估哪个垂直可能会先起来,或者有更大的市场,从而排优先级。“比如对某些行业,我们就必须要满足其需求,而对另一些行业,我们则只是尽量满足其需求,对第三种行业,那可能就是爱用不用了。”Gordon 认为对于像英特尔这么的大企业“必须学会取舍”。

另外,Gordon 也为国内的 AI 芯片企业提了一些具体的建议:

  • 首先,要找对人,找对场景非常了解人,并可以跟产业结合,那就有机会成功。而如果只是纯做技术,不跟产业、应用结合,那就走不了多远。

  • 其次,选择行业是不要一窝蜂地盲干。“国内做 AI 的企业都集中在非常窄的几个领域,比如所有人都恨不得要去做安防的,但在海外,我们就看不见这种情况,海外企业会非常专注于自己擅长的行业,而这也是很容易做成绩的方法。”

另外,ARM 的崛起也能给予大家一定的参考。

ARM 公司 1978 年在英国成立,1985 年,设计了第一代 32 位、6MHz 的处理器,它支持的指令比较简单,虽然功能远不如英特尔处理器强大,但是功耗小、价格便宜。不过,当时处理器行业的霸主是英特尔,占据着 PC 处理器市场绝大多数的市场份额。ARM 处理器能力不足,根本无法撼动英特尔在 PC 处理器的市场份额。

因此,ARM 找到了嵌入式设备市场,但是整个 20 世纪 90 年代,ARM 公司的业绩平平,处理器的出货量徘徊不前。但在而在 2007 年之后,随着智能手机时代的到来,ARM 处理器迎来了快速增长,有资料显示目前全世界 95% 的智能手机和 80% 的相机都用到了 ARM 的技术。目前 ARM 也已经成了嵌入式芯片领域的实际标准。ARM 也因此成为了一家能够与英特尔抗衡的企业。

显然,ARM 的成功经验就是找准方向,然后就是咬定青山不放松地等风来,这对 AI 芯片企业而言,显然也是一个好建议。

 

转载于:https://www.cnblogs.com/guanghuan33/p/8574224.html

相关文章:

  • 友情链接有什么用
  • Ansible杂记(2)
  • crontab详解
  • call、apply、bind的用法
  • Perl的简单联网操作
  • [svc]NFS存储企业场景及nfs最佳实战探究
  • 1安装Linux
  • underscore源码剖析之整体架构
  • HDU-2087-剪花布条
  • 关于线性基的一丢丢理解
  • 基于阿里雲Oracle12cR2(Linux)實例靜默安装Cloud Control 13c 13.3
  • Spring Boot + thymeleaf 后台与页面(二)
  • vue学习系列(二)vue-cli
  • java8简短教程(持续更新含部分9,10,11)
  • Kali linux 2018安装后全屏乱码解决
  • CNN 在图像分割中的简史:从 R-CNN 到 Mask R-CNN
  • codis proxy处理流程
  • MQ框架的比较
  • python学习笔记 - ThreadLocal
  • QQ浏览器x5内核的兼容性问题
  • rc-form之最单纯情况
  • Redis学习笔记 - pipline(流水线、管道)
  • spring cloud gateway 源码解析(4)跨域问题处理
  • 安装python包到指定虚拟环境
  • 发布国内首个无服务器容器服务,运维效率从未如此高效
  • 快速体验 Sentinel 集群限流功能,只需简单几步
  • 每天一个设计模式之命令模式
  • 让你成为前端,后端或全栈开发程序员的进阶指南,一门学到老的技术
  • 最简单的无缝轮播
  • 如何通过报表单元格右键控制报表跳转到不同链接地址 ...
  • ​如何使用ArcGIS Pro制作渐变河流效果
  • ​软考-高级-信息系统项目管理师教程 第四版【第23章-组织通用管理-思维导图】​
  • #{}和${}的区别?
  • (01)ORB-SLAM2源码无死角解析-(56) 闭环线程→计算Sim3:理论推导(1)求解s,t
  • (13):Silverlight 2 数据与通信之WebRequest
  • (1综述)从零开始的嵌入式图像图像处理(PI+QT+OpenCV)实战演练
  • (42)STM32——LCD显示屏实验笔记
  • (7)STL算法之交换赋值
  • (Bean工厂的后处理器入门)学习Spring的第七天
  • (delphi11最新学习资料) Object Pascal 学习笔记---第5章第5节(delphi中的指针)
  • (react踩过的坑)Antd Select(设置了labelInValue)在FormItem中initialValue的问题
  • (八)Spring源码解析:Spring MVC
  • (顶刊)一个基于分类代理模型的超多目标优化算法
  • (算法)Game
  • (详细版)Vary: Scaling up the Vision Vocabulary for Large Vision-Language Models
  • (一一四)第九章编程练习
  • (转) ns2/nam与nam实现相关的文件
  • *++p:p先自+,然后*p,最终为3 ++*p:先*p,即arr[0]=1,然后再++,最终为2 *p++:值为arr[0],即1,该语句执行完毕后,p指向arr[1]
  • .bat批处理(四):路径相关%cd%和%~dp0的区别
  • .NET Core 中插件式开发实现
  • .NET Framework杂记
  • .net php 通信,flash与asp/php/asp.net通信的方法
  • .NET/ASP.NETMVC 深入剖析 Model元数据、HtmlHelper、自定义模板、模板的装饰者模式(二)...
  • .NET/C# 使用 ConditionalWeakTable 附加字段(CLR 版本的附加属性,也可用用来当作弱引用字典 WeakDictionary)
  • /*在DataTable中更新、删除数据*/