HI!欢迎登录财华智库网

专注港股20年,做最有深度的原创财经资讯

其它登录方式

HI!欢迎注册财华智库网

专注港股20年,做最有深度的原创财经资讯

其它登录方式

数据中心竞赛升级:GPU需求激增背后的科技巨头对决

日期: 2024-06-12 10:36
作者: 头豹

今年来,英伟达贡献了标普500指数全部涨幅的1/3,并创造了从1万亿美元增长到2万亿美元跨越的最快纪录,市值陆续超过了亚马逊、谷歌母公司Alphabet和沙特阿美。

近日,英伟达CEO黄仁勋表示,Blackwell芯片已经投产,计划每年升级其AI加速器,并宣布将于2025年推出Blackwell Ultra GPU。

GPU作为AI计算和数据中心基础设施的关键组成部分,其技术迭代与市场应用,正深刻影响着科技产业的格局。

作为人工智能繁荣的最大受益者之一,旺盛需求让数据中心营收保持惊人增速,谷歌母公司Alphabet、微软、亚马逊和其他科技公司正在争夺英伟达高端芯片的有限供应,以争夺云计算的主导地位。

01 行业现状

智算中心集合了释放算力、调度算力、聚合算力、生产算力四个作业环节。

调度算力中智算中心通过CPU、GPU、FPGA、ASIC等底层算力资源,通过细粒度切分、算力标准化等算力池化和算力调度过程,实现算力服务管理。

人工智能模型的两个基本要素为数据集和处理能力,系统在数据集上进行训练,模型通过处理能力检测这些数据集内外部之间的关系。

在某种程度上,这两大基本要素可以相互替代:一个模型可以通过吸收更多数据或增加更多处理能力加以改进。然而,在专业人工智能芯片短缺的情况下,后者正变得越来越困难,这导致模型构建者加倍专注于寻找数据,GPU在处理大规模并行计算任务时具有明显优势,尤其在深度学习、图像识别等AI领域。

GPU:图形处理器(英语:Graphics Processing Unit,缩写:GPU),又称显示核心、视觉处理器、显示芯片,是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上做图像和图形相关运算工作的微处理器。

GPU主要由90%的ALU(运算单元),5%的Control(控制单元)、5%的Cache(缓存单元)组成。

根据应用,可将GPU分为独立GPU、集成GPU和移动GPU,可根据使用者的应用场景所需计算量进行选择。

AI芯片:目前主流的加速计算解决方案主要采用CPU系统搭载GPU、FPGA、ASIC等异构加速芯片,GPU可以支撑大量数据的并行计算,适合对数据密集型的应用进行计算和处理;FPGA可无限次编程,延时性比较低,同时拥有流水线并行和数据并行、灵活性高;ASIC通过算法固化实现极致的性能和能效、平均性很强;功耗很低;体积小。

从性能上看ASIC在三者最具优势,但目前技术开发难度最大,技术落地时间难以估计,因此预计未来AI芯片仍以GPU为主流,首先Transformer架构是最近几年的主流,该架构最大的特点之一就是能够利用分布式GPU进行并行训练,提升模型训练效率;GPU芯片通用性强,其中原本为图形计算设计的大量算数逻辑单元(ALU)可以为深度学习提供良好的加速效果。

02 行业应用

中国新能源车企早期更加关注单车智能,目前正逐步推进网联方案发展,科技公司借助AI技术,提供自动驾驶解决方案,互联网公司借助内容服务与AI,渗透自动驾驶出行服务,运营商依托蜂窝网,为网联式自动驾驶提供服务。

L1-L2级传统汽车不需要太大的车载算力,因此多采用小算力、微控制器的解决方案。从L2级开始,尤其是L3级以上的自动驾驶汽车需要装备大算力芯片支撑感知、决策算法的高效运行。根据地平线公司的预测,自动驾驶每提高一级,算力就增加一个数量级。L2级别大概需要20-80K DMIPS、5-100TOPS的算力,L3需要200K DMIPS、500+个TOPS,L4为200+K DMIPS、500+TOPS,L5为200+K DMIPS、1,000+TOPS,预计未来主要算力芯片将为GPU,随着新能源汽车自动驾驶需求的不断提升,GPU的需求也将不断扩大。

03 产业链分析

随着服务器端的需求量不断增加,倒推GPU整体产业开始新一轮发展,预计AI的算力需求将会促成GPU新一轮供不应求的局面,且此次短缺将有可能持续1-2年。

文章来源:头豹公众号

1998-2024深圳市财华智库信息技术有限公司 版权所有
经营许可证编号:粤B2-20190408
粤ICP备12006556号