加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長(zhǎng)期合作伙伴
立即加入
  • 正文
    • 01、精心炮制的“鴆酒”
    • 02、臨時(shí)的應(yīng)對(duì)方案
  • 推薦器件
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

英偉達(dá)“特供”AI芯片背后的陽(yáng)謀

06/16 09:25
1646
閱讀需 15 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

東風(fēng)吹、戰(zhàn)鼓擂,這世界誰怕誰!

皮衣老黃,最近真的飄了。

就在一周前,英偉達(dá)的市值刷出了史上新高,首次突破3萬億美元大關(guān)超越蘋果,當(dāng)時(shí)僅次于微軟。

5天后,英偉達(dá)股東大會(huì)匆匆通過了股票拆分方案,對(duì)公司股票按照1拆10的比例進(jìn)行拆分,總股本從原來的24.6億,變成了246億。

董事會(huì)認(rèn)為,較低的價(jià)格可能會(huì)讓更廣泛的投資者更容易獲得英偉達(dá)的股票所有權(quán)并刺激需求,從而可能為英偉達(dá)投資者帶來更多收益。

6月11日,分紅方案緊隨拆分計(jì)劃出臺(tái),每股派息1美分。

對(duì)于目前全球最大也是最重要的AI算力硬件提供商而言,其目前在資本市場(chǎng)的亮眼表現(xiàn),使得幾乎各方都滿足于目前這種皆大歡喜。以至于國(guó)臺(tái)辦12日在記者招待會(huì)時(shí),針對(duì)黃仁勛一周以前的妄言,都只是不痛不癢來了句“希望他好好補(bǔ)補(bǔ)課”而已。

所謂高高舉起、輕輕放下,不少人人對(duì)此感覺憋屈。但,這就是當(dāng)前掌握著能夠“卡你脖子”的核心技術(shù),帶來的“底氣”。因?yàn)榫驮?2日,有知情人士爆料內(nèi)幕消息稱,美國(guó)商務(wù)部工業(yè)與安全局(Bureau of Industry and Security,縮寫B(tài)IS),正計(jì)劃在去年10月初生效的,旨在遏制中國(guó)半導(dǎo)體技術(shù)進(jìn)步的“半導(dǎo)體制造最終用途規(guī)定”中,明文插入限制中國(guó)企業(yè)獲得全環(huán)繞柵極晶體管(GAA)技術(shù)的條款,以便進(jìn)一步封堵“漏洞”。

這是一種,可以進(jìn)一步縮小超大規(guī)模集成電路中,半導(dǎo)體器件幾何尺寸的先進(jìn)技術(shù),延緩中國(guó)企業(yè)掌握該技術(shù),將有助于美國(guó)繼續(xù)延長(zhǎng)其掌握最先進(jìn)半導(dǎo)體工藝的周期。

然而僅僅一味加碼和打壓,并不能更好地實(shí)現(xiàn)美國(guó)政府三年來奉行的“小院高墻”打壓政策。相反,還有可能損害美國(guó)企業(yè)的利益。以英偉達(dá)為例,其AI計(jì)算卡產(chǎn)品中,曾經(jīng)有近四分之一的訂單來自中國(guó)企業(yè)。

所以,無論去年十月啟動(dòng)的對(duì)華半導(dǎo)體技術(shù)最終遏制措施,還是目前最新的“補(bǔ)漏”條款,都不再以特朗普時(shí)代簡(jiǎn)單、粗暴而且全面的打壓作為手段。

并不徹底封死你獲得先進(jìn)AI算力的渠道,但需要進(jìn)行精心而且有策略的進(jìn)行限制。就好似調(diào)配一杯具備慢毒性的可口鴆酒,并將其擺在饑渴的中國(guó)企業(yè)面前。

01、精心炮制的“鴆酒”

基于BIS的規(guī)則,由英偉達(dá)一手調(diào)配,擺到中國(guó)AI企業(yè)面前的這杯“鴆酒”,名叫HGX H20。

之所以用“鴆酒”描述一款A(yù)I計(jì)算卡產(chǎn)品,乃是因?yàn)槠渥鳛橛ミ_(dá)現(xiàn)有旗艦產(chǎn)品的閹割特供版,經(jīng)由皮衣老黃精湛的“刀法”,性能控制堪稱“出色”,卡死的關(guān)鍵性能點(diǎn)也足夠歹毒——

在深度機(jī)器學(xué)習(xí)的關(guān)鍵數(shù)據(jù)INT8方面,功率為270w的H20算力僅296 Tops,TF32算力則為74 Tops。與之相比,其未“閹割”的母型H100在350w與700w功率下,算力分別達(dá)到3026/3958Tops以及756/989 Tops。

但正如成語“飲鴆止渴”,即使是這杯“鴆酒”卻也能讓企業(yè)不得不考慮喝下去。因?yàn)镠20“刀”的確實(shí)非常精妙。

HGX H20與H100都基于Hopper架構(gòu),其擁有96GB的HBM3存儲(chǔ)器,以及高達(dá)4.0 TB/s的記憶體頻寬,甚至高于3.6 TB/s的H100。另外,其NVLink頻寬也高達(dá)到900 GB/s,比起英偉達(dá)根據(jù)BIS上一版規(guī)定搞出的上代閹割版A800的400GB/s,畢竟是要高出一倍多。

基于上述狀況,有分析師根據(jù)理論數(shù)據(jù)和部分實(shí)測(cè)數(shù)據(jù)推論,盡管H100的運(yùn)算速度遠(yuǎn)超過H20,但擠掉無法實(shí)際利用的水分后,在多卡互聯(lián)用于深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練的環(huán)境下,H20在性能上仍可接近甚至達(dá)到H100的一半左右。

此外,在目前日趨流行的大語言模型(LLM)方面,由于H20使用了和最新的H200相似的技術(shù),所以在推理能力上其較之H100有了顯著提升,目前部分測(cè)試結(jié)果認(rèn)為相對(duì)要快20%以上。

這么看起來,H20似乎也不算那么差,甚至在目前炙手可熱的LLM賽道上,還具有一定的優(yōu)勢(shì)?但問題在于,BIS實(shí)際上在算力與能耗方面,也作出了硬性限制。

在上一輪限制中,BIS的將主要注意力放在了AI計(jì)算卡的傳輸速率上,試圖以此限制中國(guó)企業(yè)將其用于集群網(wǎng)絡(luò)領(lǐng)域,以避免這些計(jì)算卡繼續(xù)為這邊的國(guó)家總算力提升繼續(xù)添磚加瓦。

在上述思路下,NVLink鏈路以及互聯(lián)帶寬成為了上一輪管制的核心內(nèi)容,也就有了H800和A800這兩款“特供”計(jì)算卡的誕生。

A800相較于A100,NVLink鏈路從12條被砍到8條,互聯(lián)帶寬從600GB/s被削減到了400GB/s。H800較之H100,NVLink鏈路被從18條砍到了8條,互聯(lián)帶寬從900GB/s削減到了400GB/s。

當(dāng)時(shí)的思路,就是以削減計(jì)算卡之間數(shù)據(jù)傳輸效率,來降低其集群運(yùn)作的能力,從而限制中國(guó)企業(yè)乃至國(guó)家在總體算力上的增長(zhǎng)。而具體到單卡算力上,中國(guó)特供版中只有H800在雙精度(FP64)算力上有明顯限制。

但美方很快就發(fā)現(xiàn)了問題。因?yàn)橥ㄟ^聚合技術(shù),企業(yè)可以通過稍微降低芯片的雙向帶寬來規(guī)避管制。實(shí)際應(yīng)用于人工智能任務(wù)時(shí),上一代特供計(jì)算卡較之于性能不打折扣的原版,下降幅度幾乎可以忽略。

正因?yàn)槿绱?,時(shí)隔一年BIS在充分吸取教訓(xùn)后,直接換了一個(gè)思路,新設(shè)了計(jì)算卡的“性能密度”。根據(jù)新規(guī)開發(fā)的新一代“特供”計(jì)算卡H20,若是以能耗比來論,在INT8指標(biāo)上,其能耗算力比僅為1.1。相比之下H100則達(dá)到了8.65。

中國(guó)企業(yè)固然可以通過堆更多的計(jì)算卡,來獲得同等的算力,但代價(jià)就是更大的成本以及更高的能耗。而這兩者相互疊加將會(huì)產(chǎn)生深遠(yuǎn)的戰(zhàn)略性影響——即我國(guó)國(guó)家總體算力的提升,將在能源消耗方面比美國(guó)付出更高乃至于成倍的代價(jià)。

02、臨時(shí)的應(yīng)對(duì)方案

美國(guó)商務(wù)部的歹毒限制,以及美國(guó)資本家對(duì)于踩紅線的精妙控制,我們上文大致已經(jīng)大致說清楚了。而且這里還需要強(qiáng)調(diào)一句的是,既然是BIS擬定的管制規(guī)則,那就絕不只限于英偉達(dá)一家。

無論牙膏廠的Gaudi2、Gaudi3,蘇媽家的MI250X、MI300,等等這些產(chǎn)自美國(guó)企業(yè),或者使用了美國(guó)技術(shù)的AI計(jì)算卡,所有超出規(guī)則線的全都要禁。而若結(jié)合去年下半年出臺(tái)的,限制使用美國(guó)技術(shù)的晶圓工廠為中國(guó)企業(yè)代工半導(dǎo)體器件的嚴(yán)格限制,則國(guó)內(nèi)主攻AI計(jì)算卡的無晶圓工廠,暫時(shí)只能以現(xiàn)階段能夠基本實(shí)現(xiàn)自主的7nm制程工藝挖潛。

既然形勢(shì)如此嚴(yán)峻,國(guó)內(nèi)企業(yè)會(huì)選擇英偉達(dá)新一代“特供”產(chǎn)品H20/L20么?結(jié)合今年初以來的市場(chǎng)狀況,答案是:不會(huì)。

畢竟,事情都已經(jīng)發(fā)展到了這個(gè)份上了,中國(guó)企業(yè)若是繼續(xù)做著“在商言商”的美夢(mèng),拓展業(yè)務(wù)時(shí)單以產(chǎn)品性能以及配套生態(tài)考慮,也就無異于為了暫時(shí)緩解饑渴去飲下那杯精心調(diào)配的“鴆酒”。

自從去年末今年初BIS新限制的出臺(tái)以后,對(duì)國(guó)內(nèi)長(zhǎng)期慘遭英偉達(dá)壓制的AI計(jì)算卡提供商,實(shí)際已經(jīng)被轉(zhuǎn)變成了一波重大利好。

現(xiàn)階段,國(guó)內(nèi)這方面大的供應(yīng)商包括華為海思的昇騰系列、寒武紀(jì)的思元系列、海光信息的神算一號(hào)、燧原科技的T20/21以及i20等等。而結(jié)合半年來市場(chǎng)的反響,昇騰910B應(yīng)該是現(xiàn)階段吃到最多市場(chǎng)份額的型號(hào)。

不過,正如上文所言,這只是目前的應(yīng)對(duì)方案。但昇騰910B也遠(yuǎn)算不上完美。其主要問題如下——

首先便是其對(duì)當(dāng)前熱度最高的大模型,并不足夠友好。當(dāng)然這一點(diǎn)也是難免的,因?yàn)闀N騰910B的原型昇騰910A發(fā)布于2019年,反推其設(shè)計(jì)則不可能早于2018年初,所以也就必然錯(cuò)過了發(fā)布于2018年下的Transformer模型的熱潮(大語言模型搭建的主流框架)。

其次,在這個(gè)英偉達(dá)橫掃85%的市場(chǎng),把包括AMD、微軟、英特爾在內(nèi)的一票企業(yè)統(tǒng)統(tǒng)掃入市占比餅圖里“other”的這個(gè)時(shí)代,昇騰系列產(chǎn)品也必然存在生態(tài)匱乏的問題。

當(dāng)然在性能方面,昇騰910B在具有這些不足的情況下,依然能做到性能基本能與同代英偉達(dá)A100(基于上一代的Ampere架構(gòu))相提并論的程度,根據(jù)實(shí)測(cè),其在400w功率下其綜合性能達(dá)到了A100大約70~80%的程度。

根據(jù)目前消息,昇騰910C的測(cè)試頗為順利,如無意外將于今年9月上市??紤]到現(xiàn)階段國(guó)內(nèi)高端自主半導(dǎo)體代工仍需在7nm制程內(nèi)打轉(zhuǎn),且短期內(nèi)不太可能立即突破HBM工藝(High Bandwidth Memory,高帶寬存儲(chǔ)器,可以理解為一種先進(jìn)封裝工藝),但起碼能夠在transformer算子親和性,乃至于更好地解決多卡互聯(lián)方面取得突破,從而根本上終結(jié)對(duì)美國(guó)企業(yè)AI計(jì)算卡的單一依賴。

但正如上文所介紹的那樣,我們暫時(shí)還只能在有和無的問題上努力,而針對(duì)BIS最大的陽(yáng)謀——限制性能密度,從而實(shí)現(xiàn)中長(zhǎng)期在戰(zhàn)略上拖慢中國(guó)國(guó)家總算力增長(zhǎng)速度這方面,無論昇騰910B還是幾個(gè)月后將會(huì)發(fā)售的昇騰910C、未來的昇騰920,乃至于國(guó)內(nèi)在技術(shù)上排名前列的企業(yè),暫時(shí)都是無法破局的。

歸根到底,晶圓加工能力的瓶頸就卡在那里,需要我們自己去突破。而如果有必要的話,那些正在西部沙漠與戈壁灘上鋪開的光伏與風(fēng)力電站,也能為我們爭(zhēng)取更多的時(shí)間。

 

一年多前,某著名國(guó)際車企巨頭曾經(jīng)針對(duì)汽車的AI輔助設(shè)計(jì),進(jìn)行了一次專項(xiàng)調(diào)研,并最終確認(rèn)了通過引入更高效的AI輔助技術(shù),對(duì)于車型的更新?lián)Q代,將有著巨大的幫助。

具體到數(shù)據(jù)化的表述就是,在上世紀(jì)90年代,一款車型從產(chǎn)品規(guī)劃、方案確定,到設(shè)計(jì)以及工程樣車制造,最后一直到完成測(cè)試圖紙凍結(jié),至少需要超過50個(gè)月。

然而在充分引入AI技術(shù)輔助之后,這個(gè)周期極限情況下,可以被壓縮到20個(gè)月以內(nèi)。

各位可以比一下,近年來國(guó)內(nèi)車企在各種卷天卷地的狀況下,推出新車以及老車型換代所需的周期,則AI技術(shù)的效能和前景,可見一斑。

至于在智能駕駛的領(lǐng)域,大語言模型所具備的卓越推理能力,也正在被越來越多的企業(yè)廣泛地認(rèn)識(shí)到。

上月末,有行業(yè)內(nèi)人士稱,英偉達(dá)的H20在國(guó)內(nèi)市場(chǎng)的“供給相當(dāng)充裕”,如有明確需求可以隨時(shí)供貨。該人士同時(shí)還列舉了今年四月,國(guó)內(nèi)某科技巨頭一次下單超過三萬張計(jì)算卡的大單,并在很短的時(shí)間內(nèi)就拿齊貨的案例。

然而筆者以為,這確實(shí)不算什么“壞”消息,因?yàn)楣?yīng)充足的另一面,也代表著市場(chǎng)需求的疲軟。畢竟在2022年上半年,想要采購(gòu)A100,那是需要排隊(duì)的。

實(shí)際就英偉達(dá)而言,其對(duì)于H20這樣的產(chǎn)品也是非常不滿的。因?yàn)槠浼s10萬元人民幣的單卡售價(jià),只能達(dá)到H100的一半左右。然而卻在生產(chǎn)成本上,明顯要高上許多。

有別于H20的疲軟,其競(jìng)品昇騰910B,呈現(xiàn)的是另一幅光景。不僅單卡售價(jià)比H20高上一些,大約在12萬元上下。而且企業(yè)想要拿到貨,是需要排隊(duì)的。

之所以會(huì)有這副光景,理由也是明擺著的——起碼昇騰不會(huì)斷供。

就現(xiàn)階段來說,無論中國(guó)AI行業(yè)亦或是整個(gè)半導(dǎo)體產(chǎn)業(yè),問題距離徹底解決還非常地遙遠(yuǎn),甚至考慮到敏感話題對(duì)公眾號(hào)的危險(xiǎn)性,本文揭示的也僅僅是系列問題中一個(gè)很小的視角。

好在,至少在2024年即將過半的時(shí)間節(jié)點(diǎn)上,某種惡性循環(huán)已經(jīng)被徹底終結(jié)。

而全新的,良性的循環(huán)正在形成之中,其最終也將引導(dǎo)所有問題,走上真正的解決之道。

作者丨林登萬

責(zé)編丨查攸吟

編輯丨馬? ?悅

推薦器件

更多器件
器件型號(hào) 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊(cè) ECAD模型 風(fēng)險(xiǎn)等級(jí) 參考價(jià)格 更多信息
ATMEGA328P-MU 1 Microchip Technology Inc IC MCU 8BIT 32KB FLASH 32VQFN

ECAD模型

下載ECAD模型
$2.5 查看
ATXMEGA64D3-MH 1 Microchip Technology Inc IC MCU 8BIT 64KB FLASH 64QFN
$13.15 查看
MC9S08PA16AVTJ 1 NXP Semiconductors MICROCONTROLLER
$2.56 查看
英偉達(dá)

英偉達(dá)

NVIDIA(中國(guó)大陸譯名:英偉達(dá),港臺(tái)譯名:輝達(dá)),成立于1993年,是一家美國(guó)跨國(guó)科技公司,總部位于加利福尼亞州圣克拉拉市,由黃仁勛、克里斯·馬拉科夫斯基(Chris Malachowsky)和柯蒂斯·普里姆(Curtis Priem)共同創(chuàng)立。公司早期專注于圖形芯片設(shè)計(jì)業(yè)務(wù),隨著公司技術(shù)與業(yè)務(wù)發(fā)展,已成長(zhǎng)為一家提供全棧計(jì)算的人工智能公司,致力于開發(fā)CPU、DPU、GPU和AI軟件,為建筑工程、金融服務(wù)、科學(xué)研究、制造業(yè)、汽車等領(lǐng)域的計(jì)算解決方案提供支持。

NVIDIA(中國(guó)大陸譯名:英偉達(dá),港臺(tái)譯名:輝達(dá)),成立于1993年,是一家美國(guó)跨國(guó)科技公司,總部位于加利福尼亞州圣克拉拉市,由黃仁勛、克里斯·馬拉科夫斯基(Chris Malachowsky)和柯蒂斯·普里姆(Curtis Priem)共同創(chuàng)立。公司早期專注于圖形芯片設(shè)計(jì)業(yè)務(wù),隨著公司技術(shù)與業(yè)務(wù)發(fā)展,已成長(zhǎng)為一家提供全棧計(jì)算的人工智能公司,致力于開發(fā)CPU、DPU、GPU和AI軟件,為建筑工程、金融服務(wù)、科學(xué)研究、制造業(yè)、汽車等領(lǐng)域的計(jì)算解決方案提供支持。收起

查看更多

相關(guān)推薦

電子產(chǎn)業(yè)圖譜

汽車公社 速度、深度、態(tài)度! 汽車公社-官方訂閱號(hào),專注于汽車產(chǎn)業(yè)和新科技領(lǐng)域的前沿資訊報(bào)道。