加入星計劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴散
  • 作品版權(quán)保護
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
    • 處理性能大幅升級,滿足更廣泛需求
    • 存力升級,多項新技術(shù)賦能
    • 釋放通用CPU在AI邊緣推理中的價值
    • 推動液冷產(chǎn)業(yè)加速發(fā)展
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

奪回數(shù)據(jù)中心主導(dǎo)權(quán),英特爾新一代CPU“跨越式”升級

09/30 18:23
1494
閱讀需 12 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

日前,英特爾正式發(fā)布至強6性能核處理器(代號Granite Rapids),旨在針對AI、數(shù)據(jù)分析、科學計算等計算密集型業(yè)務(wù)提供更佳性能。

在AI迅速席卷市場的前幾年,CPU在適應(yīng)變革方面可能未能完全滿足市場期待。新一代處理器將給市場帶來哪些改變?<與非網(wǎng)>采訪了英特爾的多位生態(tài)合作伙伴,所獲評價都非常積極,包括:“讓英特爾重回巔峰”、“給合作注入更大信心”、“改變部分用戶的觀望心態(tài)”……本文就來看看至強6性能核處理器的強大之處,以及它給AI、數(shù)據(jù)中心產(chǎn)業(yè)帶來的影響。

處理性能大幅升級,滿足更廣泛需求

已宣布上市的至強6900P系列處理器(代號Granite Rapids-AP),具備三個計算單元和兩個I/O單元,最高可配備128個內(nèi)核,支持每秒6400MT的DDR5內(nèi)存、每秒8800MT的MRDIMM內(nèi)存、6條UPI 2.0鏈路(速率高達每秒24 GT),96條PCIe5.0或64條CXL 2.0通道、504MB的L3緩存,支持FP16數(shù)據(jù)格式的英特爾高級矩陣擴展(英特爾AMX),可為AI和科學計算等內(nèi)存帶寬敏感型工作負載提供MRDIMM選擇,且新增對CXL 2.0的支持。

約在2年前,市場上一個主流服務(wù)器所搭配的至強處理器約為24-48核,與之相比,至強6900P最高128個內(nèi)核的配備,大幅提升了CPU內(nèi)核數(shù)量以及整體性能,可以說是“跨越式”的表現(xiàn)。根據(jù)已透露的測試,至強6900P平臺在數(shù)據(jù)庫、科學計算等關(guān)鍵應(yīng)用負載的表現(xiàn)是上一代產(chǎn)品的2.31倍-2.5倍,AI應(yīng)用性能是其1.83倍-2.4倍。

芯片架構(gòu)是至強6性能核處理器的獨特之處,它采用了計算芯片單元與I/O芯片單元解耦的分離式模塊化設(shè)計,以Chiplet的形式封裝在一起。計算單元中包含了x86內(nèi)核、內(nèi)存控制器和緩存。I/O單元中包含了PCle、CXL、UPI等通用協(xié)議,也包括了英特爾獨有的加速器。通過不同的排列組合,使得它可以靈活組合不同數(shù)量的計算單元,實現(xiàn)核心數(shù)量的擴展及內(nèi)存和I/O的同步強化,保證更優(yōu)的整體性能和能效。

在AI加速方面,從第四代至強處理器開始,英特爾就為AI加速推出了專屬指令集——高級矩陣擴展(英特爾AMX)。通過這個指令集,CPU能夠更好地支持大模型推理計算。在最新一代的至強處理器中,該指令集也進行了升級。AI工作負載方面,至強6性能核處理器可運行12種工作負載,覆蓋通用計算、數(shù)據(jù)庫、科學計算等,其中包括Llama2、Llama3 大模型等。

與第五代至強可擴展處理器相比,至強6處理器從64核升級到128核,平均單核性能提升高達1.2倍,平均每瓦性能提升高達1.6倍,同等性能水平下平均節(jié)省30%的TCO。在運行70億參數(shù)Llama2 大模型推理時,在AMX加速的情況下,實現(xiàn)了3.08倍的性能提升。

存力升級,多項新技術(shù)賦能

算力需要平衡的升級,至強6性能核處理器除了核數(shù)多、計算性能提升,在內(nèi)存方面也進行了較大的改進,主要亮點有:

更快的內(nèi)存——MRDIMM。英特爾兩年前就開始和業(yè)界領(lǐng)先廠商就MRDIMM展開合作,目標就是能夠率先在服務(wù)器領(lǐng)域推出支持MRDIMM技術(shù)的服務(wù)器。MRDIMM利用數(shù)據(jù)緩沖區(qū),實現(xiàn)了兩個列的同步操作,從而允許一次向 CPU 傳輸 128 字節(jié)的數(shù)據(jù);而傳統(tǒng)DRAM 模塊一次只能傳輸 64 字節(jié)。英特爾至強6性能核處理器,通過使用標配6400MT/s和更快的MRDIMM內(nèi)存結(jié)合的方式,可以處理對內(nèi)存非常敏感的工作負載,包括科學計算、AI等。

更大的內(nèi)存——CXL。至強6在CXL方面的演進同樣值得關(guān)注,第五代至強正式引入CXL 2.0,用以擴展內(nèi)存容量和帶寬。至強6已經(jīng)可以支持3種CXL內(nèi)存擴展模式:CXL Numa Node、CXL Hetero Interleaved、Flat Memory。

從一系列性能規(guī)格就可以看出,新一代至強6性能核處理器在核心數(shù)量、內(nèi)存帶寬、AI加速功能方面明顯升級,這對計算密集型工作負載非常關(guān)鍵,可以覆蓋從邊緣到數(shù)據(jù)中心再到云環(huán)境中的各種AI挑戰(zhàn)。通過采用模塊化SoC架構(gòu)設(shè)計,至強6性能核處理器能夠以豐富的產(chǎn)品系列,為云服務(wù)提供商、OEM、ODM、ISV等提供靈活性和可擴展性。

釋放通用CPU在AI邊緣推理中的價值

作為算力的載體,數(shù)據(jù)中心在過去近20年中,通過不斷的演進與重構(gòu)見證和推動了科技的發(fā)展。如今,在算力需求日益飆升且多樣化的當下,至強6性能核處理器將給數(shù)據(jù)中心帶來哪些獨到價值?又將如何進一步釋放算力價值?

英特爾數(shù)據(jù)中心與人工智能集團副總裁兼中國區(qū)總經(jīng)理陳葆立認為,通用CPU進行AI推理是一個較大的機遇。盡管大模型規(guī)模在不斷增長,但是行業(yè)專用模型可能并不需要如此龐大的模型,對于許多行業(yè)用戶來說,他們實際上更傾向于使用10B以下的行業(yè)專用模型,并在這些模型中構(gòu)建專屬的知識和數(shù)據(jù)庫。根據(jù)一些客戶反饋,至強6性能核處理器進行Llama2、Llama3推理,性能已足夠應(yīng)對。此外,在一些搭載加速器或GPU的AI服務(wù)器中,絕大部分機頭選用的也都是英特爾CPU處理器,英特爾與主流的GPU廠商、AI生態(tài)合作伙伴都建立了良好的合作關(guān)系,共同定義至強規(guī)格以提供最佳的機頭體驗。

新華三集團計算存儲產(chǎn)品線副總裁劉宏程認為,至強6性能核處理器相較于上一代的性能提升并非細微改進,而是翻天覆地的變化,這可能會改變用戶以往“再等等”的觀望心態(tài),這種顯著的性能增長有望加速整個行業(yè)向新一代技術(shù)切換的進程。

他指出,過去業(yè)界常常用 “通用服務(wù)器”和“GPU服務(wù)器” 來進行區(qū)分,但在這一代服務(wù)器上,實現(xiàn)了融合的基礎(chǔ)設(shè)施,即能夠同時兼顧通用計算和GPU加速的需求。這種融合將加速各行業(yè)對新技術(shù)應(yīng)用的推動,因為用戶不再需要在不同類型的服務(wù)器之間做出選擇,而是可以更加靈活地應(yīng)對多樣化的計算需求。

由于大模型應(yīng)用到具體行業(yè),往往需要結(jié)合企業(yè)的私有數(shù)據(jù)進行微調(diào)與推理。他認為融合架構(gòu)比單一GPU服務(wù)器更適合這類需求,因為對于私域小規(guī)模的訓練和推理任務(wù)來說,融合架構(gòu)的投資回報率更高,能夠更有效地利用資源。當推理需求成為主要應(yīng)用場景時,至強6性能核處理器憑借出色的推理性能,可能成為一個更加經(jīng)濟高效的選擇。

超聚變服務(wù)器產(chǎn)品總經(jīng)理朱勇談到,面對千行百業(yè)的應(yīng)用,該處理器可以做到“一芯多用”,既可以進行通用計算、又可以做邊緣推理,目前已經(jīng)可以應(yīng)用在10B大模型的推理場景,這給客戶帶來的優(yōu)勢是能夠降低TCO。他強調(diào),“百模大戰(zhàn)”的終極挑戰(zhàn)就是商業(yè)變現(xiàn)問題,一個AI應(yīng)用的成熟落地離不開模型推理,而基于通用場景的CPU推理,能夠給客戶帶來較大的商業(yè)價值。

寧暢副總裁兼首席技術(shù)官趙雷評價,新一代至強6性能核處理器是英特爾“重回巔峰”之作,讓他覺得英特爾又重新占領(lǐng)、并且拿到了市場的主導(dǎo)權(quán),給他注入了更大信心。

英特爾市場營銷集團副總裁、中國區(qū)云與行業(yè)解決方案和數(shù)據(jù)中心銷售部總經(jīng)理梁雅莉補充,大模型的投資熱潮仍在持續(xù),接下來,整個行業(yè)將會關(guān)注如何基于通用大模型發(fā)展行業(yè)特定的大模型,這也意味著AI大模型第二場發(fā)展機遇剛剛開始,且潛力無限。她強調(diào),對于具體的行業(yè)應(yīng)用來說,推理場景不僅與行業(yè)相關(guān),而且與每個行業(yè)的具體場景密切相關(guān)。因此,未來算力的需求不僅被極大地放大,而且呈現(xiàn)出多樣化的特點。在這樣的趨勢下,“性能”和“成本”必須是一個平衡考慮,而至強6性能核處理器正是基于對未來趨勢的洞察而誕生的。

推動液冷產(chǎn)業(yè)加速發(fā)展

更強算力也讓數(shù)據(jù)中心面臨能耗和散熱挑戰(zhàn)。立足于此,英特爾發(fā)起了英特爾中國數(shù)據(jù)中心液冷創(chuàng)新加速計劃,希望攜手行業(yè)伙伴突破油類單相浸沒散熱能力有限的技術(shù)難題,進一步推動冷板式液冷整體解決方案驗證,同時還聯(lián)合生態(tài)力量推動UQD互換驗證測試,從技術(shù)創(chuàng)新、構(gòu)建統(tǒng)一行業(yè)標準兩方面“雙管齊下”,降低數(shù)據(jù)中心液冷使用成本、增強可靠性,為液冷技術(shù)的規(guī)?;瘧?yīng)用保駕護航。

聯(lián)想基礎(chǔ)設(shè)施業(yè)務(wù)群服務(wù)器產(chǎn)品部總經(jīng)理周韜分享,基于至強6性能核的聯(lián)想ThinkSystem SC750 V4服務(wù)器,是支持至強性能核的高密度服務(wù)器,主要是采用了聯(lián)想海神的溫水水冷技術(shù),可以做到100%散熱都可以通過水冷去覆蓋,測試結(jié)果顯示在生物化學、氣象這些應(yīng)用方面都有出色性能。

趙雷談到,隨著CPU算力越來越強,核數(shù)從上一代64核升級到現(xiàn)在128核,它的能耗也相應(yīng)從300瓦增加到500瓦,這也客觀推動了液冷的發(fā)展和快速落地。以往350瓦以下的CPU可以通過風冷解決散熱問題,但新一代CPU則需要更高效的散熱方案,如液冷。這一轉(zhuǎn)變不僅推動了液冷技術(shù)的進步,包括冷板、浸沒式冷卻等,還帶動了整個液冷基礎(chǔ)設(shè)施的發(fā)展。

趙雷強調(diào),液冷技術(shù)的普及將對電力基礎(chǔ)設(shè)施提出新的要求,因為隨著散熱系統(tǒng)的升級,供電能力可能成為新的瓶頸。因此,電力系統(tǒng)的改進也將成為必要。總的來說,CPU技術(shù)的進步不僅促進了液冷技術(shù)的快速發(fā)展,還將拉動整體基礎(chǔ)設(shè)施的升級優(yōu)化。

英特爾

英特爾

英特爾在云計算、數(shù)據(jù)中心、物聯(lián)網(wǎng)和電腦解決方案方面的創(chuàng)新,為我們所生活的智能互連的數(shù)字世界提供支持。

英特爾在云計算、數(shù)據(jù)中心、物聯(lián)網(wǎng)和電腦解決方案方面的創(chuàng)新,為我們所生活的智能互連的數(shù)字世界提供支持。收起

查看更多

相關(guān)推薦

電子產(chǎn)業(yè)圖譜

與非網(wǎng)資深行業(yè)分析師。主要關(guān)注人工智能、智能消費電子等領(lǐng)域。電子科技領(lǐng)域?qū)I(yè)媒體十余載,善于縱深洞悉行業(yè)趨勢。歡迎交流~