当前位置：首页 > news >正文

算力时代，算能（SOPHGO）的算力芯片/智算板卡/服务器选型

news 来源：原创 2024/7/7 15:54:35

数字经济时代，算力成为支撑经济社会发展新的关键生产力，全球主要经济体都在加快推进算力战略布局。随着大模型持续选代，模型能力不断增强，带来算力需求持续增长。算力对数字经济和GDP的提高有显著的带动作用，根据IDC、浪潮信息、清华大学联合发布的数据显示，计算力指数平均每提高1点，数字经济和GDP将分别增长3.5‰和1.8‰。

算力是芯片单位时间里处理数据的能力，算力越高，单位时间里处理的数据量越大，作为新质生产力的重要代表的智能算力网络，正在推动社会进步和经济发展。以1000 亿参数的大模型为例，预训练、推理、调优三个环节的算力总需求约18万PFlop/s-day，对应需要 2.8 万张 A100 等效的 GPU 算力。

图1：常见算力单位

根据工信部数据，我国在用数据中心机架总规模超过810万标准机架，算力总规模位居全球第二，达到了230EFLOPS，就是每秒230百亿亿次浮点运算，预计到2025年，我国算力总规模将突破300EFLOPS，由GPU、TPU、NPU带来的智能算力占比将达到35%。罗兰贝格的预测，从2018年到2030年，自动驾驶对算力的需求将增加390倍，智慧工厂需求将增长110倍，主要国家人均算力需求将从今天的不足500 GFLOPS，增加20倍，变成2035年的10000 GFLOPS。目前算力正加速向政务、工业、交通、医疗等各行业各领域渗透，未来算力产业将成为我国经济增长的重要引擎之一。

图2：AI算力芯片种类

GPU（Graphics Processing Unit）是一种主要用于图形渲染和加速图形处理任务的专用处理器，具备大量核心和高度并行的架构，特别适合处理图形渲染、影像处理和科学计算领域，因其在处理各种 AI 任务方面的多功能性而闻名，包括训练深度学习模型和执行推理操作。而以CPU提供算力，适合复杂逻辑运算，比如大多数通用软件。

TPU：张量处理器（Tensor Processing Unit）是Google为机器学习定制的专用芯片（ASIC），专为Google的深度学习框架TensorFlow而设计，由于相比GPU牺牲了处理器的通用型，可快速高效地执行张量运算，因此在特定任务中TPU的性能表现更佳。例如，在 V100 GPU 上使用 BERT 模型处理一批 128 个序列需要 3.8 毫秒，而在 TPU v3 上则需要 1.7 毫秒。

图3：CPU、GPU和TPU的芯片架构区别

张量处理器（TPU）与图形处理器（GPU）相比，具备如下特点：

（1）TPU采用低精度（8位）计算，可以减少每步操作使用的晶体管数量，而降低精度对于深度学习的准确度影响很小，但却可以大幅降低功耗、加快运算速度。

（2）TPU使用了脉动阵列的设计，用来优化矩阵乘法与卷积运算，减少I/O操作。

（3）TPU还采用了更大的片上内存以减少对DRAM的访问，从而更大程度地提升性能。

这种专业化通常使 TPU 在特定的深度学习任务（尤其是经过 Google 优化的任务）中表现优于 GPU，例如广泛的神经网络训练和复杂的机器学习模型。谷歌2024年5月发布第六代张量处理器Trillium，芯片的峰值计算性能提高4.7倍达到约925.9 teraflops，能效指标也比上一代提升67%。

一、算能（SOPHGO）简介

算能（SOPHGO）成立于2020年，总部位于北京市，公司致力于成为全球领先的定制算力提供商。算能科技汇聚了大量芯片、算法、AI、CPU等领域的专业技术人才，研发人员比例超过60%，其中硕博士超过61%。算能科技与比特大陆（BITMAIN）在AI领域有技术、专利、产品和客户的共享，继承了比特大陆在AI领域的技术积累，专注于AI芯片、RISC-V CPU等算力产品的研发和销售。

算能公司遵循全面开源开放的生态理念，携手行业伙伴推动RISC-V高性能通用计算产业落地；打造覆盖“云、边、端”的全场景产品矩阵，为数据中心、AIGC、城市运营、智能制造、智能终端等多元场景提供算力产品及整体解决方案。产品已广泛应用在智能视频、智能安防、智能交通、智能电力、智能医疗、智能油气、智能语义、智能推荐、城市大脑等场景。