加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
    • ?01、前所未有的壓力
    • ?02、CPU開始淪為配角
    • ?03、AI趨勢下,英特爾、AMD能分到一杯羹嗎?
  • 推薦器件
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

?CPU開始淪為配角

2023/10/10
4570
閱讀需 13 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

作者:九林

最近,英特爾財(cái)務(wù)長DavidZinsner表示,雖然數(shù)據(jù)中心芯片需求在過去兩季有所好轉(zhuǎn),但庫存消化將比電腦芯片更長,可能還要過幾季才能達(dá)到較佳的狀態(tài)。在這個AI被炒的火熱的時代,當(dāng)英特爾說數(shù)據(jù)中心芯片的庫存正在積壓,出乎很多人的意料。

?01、前所未有的壓力

PC產(chǎn)業(yè)正同時經(jīng)歷“加速運(yùn)算”和“生成式AI”兩大轉(zhuǎn)變。據(jù)Gartner最新報(bào)告,2023年全球用于AI的硬件銷售收入預(yù)計(jì)將達(dá)到534億美元,按年增長20.9%,這一銷售還將在2024年進(jìn)一步增長到671億美元,在2027年進(jìn)一步增長到1194億美元。

今年,不少互聯(lián)網(wǎng)公司紛紛開發(fā)自己的大模型。3月,百度制作了類似ChatGPT的項(xiàng)目ErnieBot;4月,騰訊云發(fā)布了新的服務(wù)器集群,該集群可供其他人租用計(jì)算能力;阿里巴巴計(jì)劃將所有產(chǎn)品插入大型語言模型,包括在線購物平臺淘寶和地圖工具高德地圖。

據(jù)報(bào)道,目前百度、騰訊、阿里巴巴和字節(jié)跳動四家公司合計(jì)向英偉達(dá)訂購了價值50億美元的AI芯片。這些芯片包括英偉達(dá)2023年發(fā)貨的10萬塊A800芯片,價值10億美元,另外價值40億美元的芯片將在2024年交付。

數(shù)據(jù)中心芯片風(fēng)光一時無兩。目前,數(shù)據(jù)中心領(lǐng)域有三大巨頭:英特爾、英偉達(dá)、AMD。在數(shù)據(jù)中心CPU方面,根據(jù)Counterpoint數(shù)據(jù),2022年英特爾以71%的份額保持?jǐn)?shù)據(jù)中心市場的領(lǐng)先地位,AMD以20%的市場份額位居第二。

在數(shù)據(jù)中心GPU方面,英偉達(dá)不僅占有一席之地,甚至可以說幾乎“壟斷”。英偉達(dá)數(shù)據(jù)中心產(chǎn)品的客戶主要來自云服務(wù)商和大型互聯(lián)網(wǎng)公司,它們貢獻(xiàn)了英偉達(dá)大約一半的數(shù)據(jù)中心收入。英偉達(dá)的GPU用于ChatGPT等人工智能應(yīng)用程序背后大模型的訓(xùn)練和推理,目前科技公司對英偉達(dá)最高端的人工智能芯片H100的需求極大。

從今年的業(yè)績來看,英偉達(dá)是毋庸置疑的收入暴漲,尤其是在數(shù)據(jù)中心領(lǐng)域,在英偉達(dá)公布的截至7月30日的季度財(cái)報(bào)中,英偉達(dá)數(shù)據(jù)中心業(yè)務(wù)收入增長141%至103億美元,占其總收入比超過76%。按照這種趨勢,有分析師估計(jì),到2025財(cái)年,英偉達(dá)的數(shù)據(jù)中心部門收入將擴(kuò)大到400億美元。

英偉達(dá)如此強(qiáng)勢,其他兩大巨頭自然頗受影響。

AMD對數(shù)據(jù)中心同時供應(yīng)CPU、GPU、FPGA、DPU和SoC,二季度AMD的數(shù)據(jù)中心業(yè)務(wù)下滑了。根據(jù)其財(cái)報(bào)數(shù)據(jù),AMD數(shù)據(jù)中心營收為13.21億美元,同比下滑11%。AMD坦言,報(bào)告期內(nèi)的Epyc處理器銷售沒有預(yù)期那么好,而且加大的研發(fā)支出也攤薄了利潤率。

從二季度的業(yè)績來看,英特爾數(shù)據(jù)中心和人工智能業(yè)務(wù)銷售額從去年同期的47億美元下降15%至40億美元。英特爾首席執(zhí)行官帕特·基辛格表示,服務(wù)器CPU的庫存過剩將持續(xù)到今年下半年,數(shù)據(jù)中心芯片銷售將在第三季度小幅下降,在第四季度恢復(fù)。

對于英特爾抱怨數(shù)據(jù)中心芯片庫存積壓,分析師陸行之表示:“庫存難消耗有兩種原因,一是產(chǎn)能利用率維持高檔不墜、超過穩(wěn)定需求,二是需求下降速度快過產(chǎn)能利用率下降速度。”他認(rèn)為,英特爾在數(shù)據(jù)中心早已喪失話語權(quán)。依據(jù)預(yù)算的排擠效應(yīng),每買一臺AI服務(wù)器,就少買幾臺通用服務(wù)器,即使功用不盡相同,但這趨勢應(yīng)該會持續(xù)數(shù)個季度,甚至數(shù)年。

一臺AI服務(wù)器價格比通用服務(wù)器貴20倍以上,也因此客戶無法大幅加碼服務(wù)器采購預(yù)算,只能少買數(shù)臺通用服務(wù)器。如果一臺AI服務(wù)器使用兩顆英特爾的CPU,假設(shè)少買三臺,那就少了6顆比較便宜的CPU需求,也就是為什么英特爾的CPU庫存被積壓。

實(shí)際上,不止陸行之認(rèn)為英特爾在數(shù)據(jù)中心早已喪失話語權(quán)。Global X分析師Tejas Dessai也認(rèn)為,英特爾等對于AI著墨不深的傳統(tǒng)芯片企業(yè),恐面臨市占率下滑窘境。也有業(yè)內(nèi)人士表示,生成式AI改變了數(shù)據(jù)中心平臺的戰(zhàn)局,英特爾、AMD正面臨前所未有的壓力。

?02、CPU開始淪為配角

今年的市場中,通用服務(wù)器和AI服務(wù)器需求出現(xiàn)了兩極分化。

AI服務(wù)器和通用服務(wù)器的差異是什么?實(shí)際上,比起通用服務(wù)器以CPU為主要算力,AI服務(wù)器則是以GPU為主要架構(gòu),通過異質(zhì)運(yùn)算架構(gòu)提高運(yùn)算能力。目前依據(jù)應(yīng)用的類型,AI服務(wù)器可以分為訓(xùn)練和推理兩種。

從前電腦、服務(wù)器最重要的零組件是CPU,但隨著需要大量運(yùn)算能力的AI應(yīng)用出現(xiàn)后,CPU開始淪為配角,GPU的時代開啟了。

從目前AI服務(wù)器的市場來看,一張主板需要1~8個GPU、1~2個CPU,以及1個Arm Grace CPU,其中英偉達(dá)的GPU市場占有率超過8成,并以運(yùn)算效能達(dá)5 PetaFLOPS的DGX A100和H100為AI服務(wù)器運(yùn)算主力。

即使英偉達(dá)的GPU價格高昂,但是效率是遠(yuǎn)高于其他產(chǎn)品的。一起來算一筆賬,假設(shè)建置數(shù)據(jù)中心預(yù)算為1000萬美元,可以選擇建置1座搭載960顆CPU、電力消耗達(dá)11GW的數(shù)據(jù)中心,可提供1倍的大型語言模型LLM處理性能;但是選擇建置1座有48顆GPU、功耗僅需3.2GW的數(shù)據(jù)中心,且LLM資料處理量是CPU的44倍。

從綜合成本收益來看,還是占優(yōu)。更何況英偉達(dá)GPU在人工智能的推理和計(jì)算方面獨(dú)具優(yōu)勢。因此一些財(cái)務(wù)實(shí)力不雄厚甚至負(fù)債累累的初創(chuàng)企業(yè)也在搶購英偉達(dá)芯片。這也就是為什么黃仁勛之前表示:買的越多,省的越多(The more you buy,the more you save.)。

在15年前,黃仁勛就表示,CUDA運(yùn)算效果較CPU高出10~100倍。GPU應(yīng)用能力早已不亞于CPU,甚至更勝一籌,自家GPU持續(xù)擴(kuò)大生態(tài)系統(tǒng)(ecosystem),全新視覺運(yùn)算世代即將來臨。今年,黃仁勛更是直接說到:“盡管CPU過去幾年運(yùn)算速度不斷提升,但進(jìn)入AI時代后,以CPU為運(yùn)算基礎(chǔ)的時代已經(jīng)結(jié)束,現(xiàn)在大型語言模型(LLM)需要更新的解決方案?!?/p>

業(yè)界分析師估計(jì),AI芯片市場有超過8成掌握在英偉達(dá)手里。在一篇名為《Nvidia H100 GPU:供需》文章中,深度剖析了當(dāng)前科技公司們對GPU的使用情況和需求。文章推測,小型和大型云提供商的大規(guī)模H100集群容量即將耗盡,H100的需求趨勢至少會持續(xù)到2024年底。不過,目前英偉達(dá)GPU的產(chǎn)能受到供應(yīng)鏈的限制,給英特爾和AMD反超的機(jī)會。

?03、AI趨勢下,英特爾、AMD能分到一杯羹嗎?

英特爾不會放過AI發(fā)展的浪潮。今年英特爾在加州圣何塞舉辦Innovation 2023活動中,AI是貫穿始終的主旋律。

演講開篇,英特爾執(zhí)行長帕特·基辛格便表示,AI正在催生全球增長的新時代,在新時代當(dāng)中,算力便起到了重要的作用,開發(fā)者正迎來巨大的商業(yè)和社會機(jī)會——算力離不開芯片,如今芯片形成了規(guī)模達(dá)5740億美元的行業(yè),驅(qū)動著全球背后約8萬億美元的技術(shù)經(jīng)濟(jì)。

數(shù)據(jù)中心方面,英特爾將數(shù)據(jù)中心芯片分為兩類,包括著重效能但耗能更高的Granite Rapids芯片,以及聚焦能源效率的Sierra Forest芯片。目前英特爾新款數(shù)據(jù)中心芯片“Sierra Forest”已經(jīng)預(yù)定明年上市,每瓦性能將比目前的數(shù)據(jù)中心芯片提高240%。這是英特爾首次披露這類數(shù)據(jù),對性能的提前披露,也能看出英特爾頗為著急。

看一下Granite Rapids和Sierra Forest這兩款數(shù)據(jù)中心芯片的具體細(xì)節(jié)。Sierra Forest,它是英特爾首款用于數(shù)據(jù)中心的E核Xeon可擴(kuò)展芯片,還是基于EUV的Intel 3工藝的主導(dǎo)產(chǎn)品。Granite Rapids可將AI工作負(fù)載性能提升2-3倍,實(shí)現(xiàn)2.8倍的更好內(nèi)存帶寬,內(nèi)存模組MCR DIMM帶寬可提高30-40%。

英特爾預(yù)估,在AI戰(zhàn)場,還需要幾年時間,應(yīng)該就可以追上NVIDIA在高端AI相關(guān)的進(jìn)展,除此之外,英特爾在HPC是具有高度優(yōu)勢,HPC與AI未來是會匯聚,英特爾除了AI持續(xù)進(jìn)展,HPC更具有優(yōu)勢。

AMD也在發(fā)力。AMD也跟英特爾一樣面臨產(chǎn)品推出時機(jī)落后的問題,旗艦AI芯片MI300目前僅少量送樣,要到明年才會上市。AMD數(shù)據(jù)中心硬件部門主管諾羅德(Forrest Norrod)表示,ChatGPT引爆的AI熱潮是AMD始料未及的。

目前,AMD已經(jīng)將人工智能作為分配資源和投資的首要領(lǐng)域。AMD正在增加AI相關(guān)的研發(fā)支出,并已經(jīng)制定AI戰(zhàn)略——包括AI專用芯片和軟件的開發(fā)。

對標(biāo)英偉達(dá)AI芯片H100的大模型專用芯片,AMD的MI300X號稱HBM密度高達(dá)英偉達(dá)H100的2.4倍,HBM帶寬高達(dá)H100的1.6倍,單個芯片可運(yùn)行多達(dá)800億參數(shù)的模型,可以運(yùn)行比H100更大的模型。

也有市場機(jī)構(gòu)看好AMD,Northland資本市場分析師理查(Gus Richard)預(yù)期,AMD未來可望在AI芯片市場拿下20%市占率。他認(rèn)為除了AMD芯片表現(xiàn)不凡之外,AMD與大型數(shù)據(jù)中心的合作關(guān)系也有利AI芯片銷售。

值得注意的是,從晶圓代工的角度來看,數(shù)據(jù)中心芯片對高級節(jié)點(diǎn)的需求不斷增加。AMD在最近5年中崛起,并且在PC、服務(wù)器領(lǐng)域能夠威脅英特爾,其2018年宣布擁抱臺積電7nm是個關(guān)鍵決定。而英偉達(dá)也一直和臺積電關(guān)系緊密,盡管部分產(chǎn)品因分散風(fēng)險(xiǎn)、價格考量而轉(zhuǎn)由三星代工,如先前的RTX 30系列,但面臨三星制程技術(shù)落后下,最終RTX 40系列也回歸臺積電。

不管怎么說,在英特爾和AMD最新的數(shù)據(jù)中心芯片明年大量出貨之前,英偉達(dá)的高端GPU沒有抗打的對手。

推薦器件

更多器件
器件型號 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊 ECAD模型 風(fēng)險(xiǎn)等級 參考價格 更多信息
MK70FX512VMJ15 1 Freescale Semiconductor Kinetis K 32-bit MCU, ARM Cortex-M4 core, 512KB Flash, 150MHz, Graphics LCD, MAPBGA 256

ECAD模型

下載ECAD模型
$17.99 查看
STM32F207IGH6TR 1 STMicroelectronics High-performance Arm Cortex-M3 MCU with 1 Mbyte of Flash memory, 120 MHz CPU, ART Accelerator, Ethernet

ECAD模型

下載ECAD模型
$69.82 查看

相關(guān)推薦

電子產(chǎn)業(yè)圖譜

公眾號:半導(dǎo)體產(chǎn)業(yè)縱橫。立足產(chǎn)業(yè)視角,提供及時、專業(yè)、深度的前沿洞見、技術(shù)速遞、趨勢解析,鏈接產(chǎn)業(yè)資源,構(gòu)建IC生態(tài)圈,賦能中國半導(dǎo)體產(chǎn)業(yè),我們一直在路上。