加入星計劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
    • 地表最強(qiáng)CPU,換代了?
    • 數(shù)據(jù)中心的成本,怎么算?
    • 成年人,如何做選擇題?
  • 推薦器件
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

一顆芯片賣十萬,AMD到底憑什么?

07/11 10:55
3169
閱讀需 16 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

當(dāng)年王思聰花100萬組的電腦,你知道用的什么CPU嗎?答案就是,AMD EPYC 7763,每顆6.5萬元,64核、基頻2.45GHz,號稱地表最強(qiáng)。

只不過,這顆芯片現(xiàn)在已經(jīng)過時了。

現(xiàn)在最強(qiáng)的CPU,挑起來估計還要費一番心思,因為有的主頻能到4.4GHz、有的集成了128個內(nèi)核、有的緩存超過1GB、有的跑分默秒全。挑起來有點糾結(jié),但這些芯片仍然全部來自AMD。

我們普通人玩玩游戲可能用不上服務(wù)器級別的高端CPU,但這塊業(yè)務(wù)是真的掙錢,總結(jié)來說就是四高:高營收、高利潤、高技術(shù)含量、高護(hù)城河。因此,數(shù)據(jù)中心也一直是芯片巨頭們的必爭之地。AMD最近兩年股價蹭蹭起飛,你以為靠的是筆記本和臺式機(jī)的CPU嗎,其實背后的主要推動力還是來自于數(shù)據(jù)中心。

甚至可以這么說,蘇媽上臺之后最大的功績,就是領(lǐng)導(dǎo)AMD在數(shù)據(jù)中心領(lǐng)域?qū)崿F(xiàn)了對友商的完美逆襲。對了,咱1v1專訪過蘇媽,都熟人,一定記得去看這期視頻:

但是,服務(wù)器CPU并不是越貴越好,有錢任性如王公子,選擇AMD的EPYC而不是藍(lán)廠的至強(qiáng),說的也很明白,一個是性能秒殺、一個是至強(qiáng)貴……說白了,就是因為EPYC性價比好。

都說成年人不做選擇,怎么選一個服務(wù)器CPU就這么難呢?

地表最強(qiáng)CPU,換代了?

AMD服務(wù)器CPU的名字叫EPYC,和史詩的英文epic諧音,這應(yīng)該是蘇媽給起的名字,說明她對于服務(wù)器和數(shù)據(jù)中心業(yè)務(wù)還是寄予了厚望,當(dāng)然咱們現(xiàn)在看是賭對了。EPYC和普通消費級CPU Ryzen都是基于Zen架構(gòu),只不過EPYC的黑科技更多性能也更強(qiáng),當(dāng)然也貴得多了。

從AMD服務(wù)器CPU的路線圖來看,就能直觀的發(fā)現(xiàn)他們的戰(zhàn)略就是下餃子+堆料,不管是芯片數(shù)量還是細(xì)分的種類都越來越多了,而且黑科技越堆越多,感覺蘇媽也是暴力美學(xué)的忠實信徒。2017年三月,AMD宣布重新回歸服務(wù)器芯片市場,并且基于Zen架構(gòu)退出了第一代EPYC處理器,代號“那不勒斯”。

兩年之后的2019年發(fā)布了第二代"羅馬",基于Zen2架構(gòu),性能暴漲的同時也支持最高64核心,成為AMD EYPC處理器的第一個爆款。又過了兩年,發(fā)布了第三代EPYC“米蘭”系列,雖然最大仍是64核,但由于Zen3架構(gòu)的加持,單核性能再次起飛,這也是王思聰選的那款。

不僅如此,第三代還首次產(chǎn)生了一個名叫“米蘭-X”的支線系列,采用了名叫3DV-Cache的堆疊式內(nèi)存黑科技,最高支持768MB總緩存,遙遙領(lǐng)先友商。而AMD的股價,也在2021年底創(chuàng)下新高,比EPYC芯片剛發(fā)布時漲了十倍多。

2022年底,第四代EPYC發(fā)布,這次不是只有一個、也不只兩個,而是一口氣發(fā)了四顆芯片。其中旗艦款“熱那亞”EPYC9654包含96核,比藍(lán)廠旗艦至強(qiáng)8380性能提升達(dá)4倍,也創(chuàng)下了當(dāng)時的性能記錄。不僅如此,還有支持云原生應(yīng)用的、最高128核的“貝加莫”;再次用第二代3D V-Cache創(chuàng)下1152MB緩存記錄的“熱那亞-X”,還有一個新的低功耗系列“錫耶納”。

都說大模型現(xiàn)在流行暴力美學(xué),但我覺得AMD EYPC處理器的發(fā)展才更像是暴力美學(xué)。咱也不給你百分之幾的擠牙膏,就是百分之幾十甚至成倍的堆核、堆緩存容量、堆工藝、堆性能,走自己的路,讓別人無路可走。

表面上看AMD在不斷擴(kuò)展數(shù)據(jù)中心處理器的產(chǎn)品線,這背后其實代表著AMD已經(jīng)逐漸打通了支撐這些產(chǎn)品擴(kuò)展的底層關(guān)鍵技術(shù),比如更可靠的3D封裝技術(shù)、內(nèi)核架構(gòu)的不斷進(jìn)化等等,之前的問里也講了很多。

但千萬不要天真的認(rèn)為,技術(shù)做牛x就完事兒了。因為在服務(wù)器和數(shù)據(jù)中心領(lǐng)域,除了技術(shù)之外,成本也是各家云廠商關(guān)心的重要因素。和綠廠賣卡炒上天價不一樣的是,AMD在數(shù)據(jù)中心里主打一個性價比,既要讓性能高,又能保證成本低。即使你一顆芯片賣小十萬塊,但只要你帶來的好處超過十萬、二十萬甚至更多,那這就是一筆合算的生意。

為了實現(xiàn)這個目標(biāo),就不得不提AMD用的大招:高核心密度,也就是讓一顆芯片里包含的核心數(shù)量足夠高、每顆核心的性能又足夠強(qiáng),同時采用最先進(jìn)的制造工藝,讓整顆芯片的功耗又足夠低,再賣的便宜點 —— 這幾個因素結(jié)合起來,就能帶來成倍的成本降低。

數(shù)據(jù)中心的成本,怎么算?

光說概念大家聽起來比較抽象,咱們通過幾個例子來具體看看。我的偶像小Lin姐不是有個小Lin奶茶店嗎,咱們也開個店,就叫老石數(shù)據(jù)中心,這投入得怎么著也得大幾千萬打底。之前看過一個評論,說數(shù)據(jù)中心不用擔(dān)心功耗。我覺得留言的人應(yīng)該說的是不用擔(dān)心芯片的功耗釋放,但數(shù)據(jù)中心恰恰最關(guān)心的就是功耗:因為功耗代表的是實打?qū)嵉碾娰M。甭管咱們數(shù)據(jù)中心有沒有人用,只要機(jī)器開著,電費就得嘎嘎交。

除了電費,數(shù)據(jù)中心還有哪些成本呢?如果我列的話,應(yīng)該還有采購服務(wù)器的的成本、租場地的成本、雇人、買軟件等等這些管理成本等等。在數(shù)據(jù)中心領(lǐng)域,衡量成本關(guān)鍵指標(biāo)叫TCO(Total Cost of Ownership),中文叫總擁有成本,它就是上面所有這些開支的總和。

那么為什么采用AMD CPU之后TCO會更低呢?我來給你算算賬。比如老石數(shù)據(jù)中心主要做云計算的應(yīng)用,我的用戶大都是為了跑個虛擬機(jī)搞點開發(fā)啥的。我們可以畫個坐標(biāo)軸,橫軸是虛擬機(jī)數(shù)量,縱軸是算力。這里算力我們就按SPEC int跑分來看,每個CPU的跑分值在網(wǎng)上都能查到,都是透明的信息。那我們既可以看當(dāng)算力一定時,用誰家的CPU能帶來更多虛擬機(jī)數(shù)量;或者當(dāng)虛擬機(jī)數(shù)量一定的時候,看誰的算力更大,同時也能計算每種情況帶來的總成本TCO。

打個比方,如果我想要的總算力是1800分,那用搭載AMD第四代EPYC 9654的一臺2P服務(wù)器就夠了,一顆芯片有96個內(nèi)核,整個服務(wù)器就是2x96=192個核,能跑192個虛機(jī)。相比之下,如果用藍(lán)廠友商的第四代至強(qiáng)白金8490H,單顆芯片60個核,要達(dá)到跑分要求的話需要兩臺服務(wù)器,一共240核??雌饋肀華MD能跑的虛機(jī)數(shù)量要多。

再來看成本。AMD芯片的單價11800美元,單個虛擬機(jī)成本61.46美元,至強(qiáng)一顆建議零售價17000美元,兩顆34000,單個虛機(jī)成本141.67美元,是AMD的兩倍還多,這還不算多買一臺服務(wù)器本身和配件帶來的額外開銷。

再看功耗,兩家單顆芯片的功耗差不多,都是350W左右,但藍(lán)廠需要兩臺機(jī)器,功耗直接翻番,電費也翻番。另外,由于需要兩臺機(jī)器,也需要更多的運維和場地成本等。這幾個因素加起來,整體TCO誰高誰低就很清楚了。省下來的錢咱們多買點好吃的,多給大家抽抽獎,同意的點贊。

同理我們也可以算下當(dāng)需要的虛擬機(jī)數(shù)量相同的時候、比如都需要2000個虛擬機(jī),帶來的TCO開銷。這里我就不再一一計算了,感興趣的朋友可以按前面的數(shù)據(jù)自己算一下,答案可以寫在下方評論區(qū)里。

前面說了,第四代EPYC新推出了一個“貝加莫”產(chǎn)品線,主打超多核心。比如EPYC 9754就包含了128個核心、256線程,就是為了支持更多用戶跑虛機(jī)等等這些云原生應(yīng)用而專門優(yōu)化的。這里多提幾句技術(shù)細(xì)節(jié),為了在一顆芯片里放下這么多核心,貝加莫采用了Zen4c內(nèi)核架構(gòu)。和Zen4相比,Zen4c把3級緩存容量砍掉一半,其他不變,這樣芯片的整體面積就縮減了35%。

這種砍緩存的方法其實也是業(yè)界常用的縮體積的方法,我們開發(fā)處理器的時候也常用。這種方法的好處是既能縮小單個核的面積,在芯片里塞進(jìn)去更多的內(nèi)核,又能和標(biāo)準(zhǔn)Zen4完全兼容,不用修改軟件代碼,并且可以根據(jù)需要進(jìn)行無縫切換。當(dāng)然代價就是性能肯定比標(biāo)準(zhǔn)Zen4有所下降,畢竟三緩小了一半。但即便如此,貝加莫也比前一代米蘭的性能有2.5倍的提升。

從芯片架構(gòu)上來看,貝加莫是一個很典型的基于芯粒的層次化設(shè)計。整顆芯片由8個CCD、也就是核心芯粒(Core Chip Die)組成。每個CCD上又包含了兩個CCX、也就是核心復(fù)合體(Core Complex);每個CCX由包含了8個Zen4C內(nèi)核,以及它們共享的16MB三級緩存。這種層次化設(shè)計的好處,一個是降低了流片制造的成本和風(fēng)險,因為不需要做一個特別大的、包含幾十個內(nèi)核的芯片,這種制造起來良率會指數(shù)級降低,而造很多個CCD就會良率高很多;另一個就是很好擴(kuò)展,這些單元就像不同大小的樂高,在一定程度上可以排列組合。如果我想要一個64核的CPU,主打一個低功耗高能效,那直接上下各去掉兩個CCD就OK了,而這恰恰也是第四代EYPC的另外一個新款「錫耶納」。

那如果我在老石數(shù)據(jù)中心里用前面說的這幾芯片,上面兩道題該怎么算TCO呢?如果這你都能算出來,去這些芯片大廠應(yīng)聘銷售應(yīng)該問題就不大了。也歡迎在評論區(qū)說說你的答案。

我們再來看另外一個場景,也是我日常工作中特別需要的——跑EDA軟件。和云計算不一樣的是,EDA軟件很多都對多核并行優(yōu)化的不咋好,所以特別吃單核性能,怎么著也得3GHz打底,也特別需要大緩存。而且很多EDA軟件是基于核心數(shù)收費的,所以更需要高主頻的CPU,能少用一個核算一個。說到單核性能和高主頻,AMD的9174F最高能跑到4.4GHz,基頻也有4.15GHz,在服務(wù)器CPU領(lǐng)域已經(jīng)默秒全了,關(guān)鍵是售價「僅有」3850美刀。不多說了,我去打個報告申請換服務(wù)器了……

其實,也并不是說EDA軟件就不需要多核性能。比如仿真或者芯片前端設(shè)計的時候,還是會有很多需要大批量小任務(wù)高并行的場景。這個時候用前面說的96核EPYC9654也很OK,基頻3.55GHz,最高可以跑到3.7GHz。

面對EDA軟件大緩存的需求,AMD的第四代EPYC有一個名叫熱那亞-X的產(chǎn)品線,它最大的特點就是采用了第二代3D V-Cache內(nèi)存堆疊技術(shù),把內(nèi)存堆料進(jìn)行到極致。這顆芯片上最多集成12個內(nèi)存芯粒,每個芯粒集成64MB內(nèi)存,再加上CPU上的原生123級緩存,這樣整個處理器的緩存可以達(dá)到1152MB,這也是單個CPU芯片首次緩存容量突破1GB大關(guān)。

所以用了熱那亞-X之后,仿真軟件VCS的性能提升高達(dá)73%,相當(dāng)于原來需要跑一個星期的仿真,現(xiàn)在只需要兩天就搞定了,效率提升肉眼可見。不多說了,我再去打個報告申請換服務(wù)器了(梅開二度)……

成年人,如何做選擇題?

不管是王思聰還是老石數(shù)據(jù)中心,買CPU還真的不是一個簡單的選擇題,不是有錢任性買最貴的就一定最好。每個人都在追求性價比,但在成年人的世界里,性價比并不是性能高+價格便宜這么簡單,而是高性能低功耗、高核心密度低使用成本,各種因素不做選擇題我全都要的過程。當(dāng)然技術(shù)在這里是特別重要的推動力量,比如AMD之所以做出來這么多EPYC子產(chǎn)品系列,就是為了把一個不可能既要又要的大問題拆分成一些小問題,然后在各自的細(xì)分領(lǐng)域深入優(yōu)化的結(jié)果。所以即使賣小十萬,也仍然性價比拉滿。不選最貴,只選最好。

對于普通消費者來說,裝一臺電腦打打游戲遠(yuǎn)遠(yuǎn)花不了幾十上百萬,有人說我們可能永遠(yuǎn)也用不到這些黑科技。但如果你想想現(xiàn)在PC電腦的CPU處理器里又是多核、又是AI引擎,果子還有所謂的統(tǒng)一內(nèi)存架構(gòu),這不都是服務(wù)器CPU玩過的技術(shù)嗎。所以這些現(xiàn)在看起來用不上的黑科技,說不定未來就會出現(xiàn)在普通人的電腦里,這也是種技術(shù)的傳承吧。

(注:本文不代表老石任職單位的觀點。)

推薦器件

更多器件
器件型號 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊 ECAD模型 風(fēng)險等級 參考價格 更多信息
STM32F767ZIT6 1 STMicroelectronics High-performance and DSP with FPU, Arm Cortex-M7 MCU with 2 Mbytes of Flash memory, 216 MHz CPU, Art Accelerator, L1 cache, SDRAM, TFT, JPEG codec, DFSDM

ECAD模型

下載ECAD模型
$25.18 查看
ATXMEGA128D4-MH 1 Atmel Corporation RISC Microcontroller, 16-Bit, FLASH, AVR RISC CPU, 32MHz, CMOS, PQCC44, 7 X 7 MM, 1 MM HEIGHT, 0.50 MM PITCH, GREEN, PLASTIC, MO-220VKKD-3, VQFN-44
$5.3 查看
FS32K146HAT0MLLT 1 NXP Semiconductors RISC Microcontroller

ECAD模型

下載ECAD模型
$11.53 查看

相關(guān)推薦

電子產(chǎn)業(yè)圖譜

微信公眾號“老石談芯”主理人,博士畢業(yè)于倫敦帝國理工大學(xué)電子工程系,現(xiàn)任某知名半導(dǎo)體公司高級FPGA研發(fā)工程師,從事基于FPGA的數(shù)據(jù)中心網(wǎng)絡(luò)加速、網(wǎng)絡(luò)功能虛擬化、高速有線網(wǎng)絡(luò)通信等領(lǐng)域的研發(fā)和創(chuàng)新工作。曾經(jīng)針對FPGA、高性能與可重構(gòu)計算等技術(shù)在學(xué)術(shù)界頂級會議和期刊上發(fā)表過多篇研究論文。