99热这里只有精品66,鳄鱼波鞋走天涯

日前，英特爾正式發(fā)布至強6性能核處理器（代號Granite Rapids），旨在針對AI、數(shù)據(jù)分析、科學計算等計算密集型業(yè)務(wù)提供更佳性能。

在AI迅速席卷市場的前幾年，CPU在適應(yīng)變革方面可能未能完全滿足市場期待。新一代處理器將給市場帶來哪些改變？<與非網(wǎng)>采訪了英特爾的多位生態(tài)合作伙伴，所獲評價都非常積極，包括：“讓英特爾重回巔峰”、“給合作注入更大信心”、“改變部分用戶的觀望心態(tài)”……本文就來看看至強6性能核處理器的強大之處，以及它給AI、數(shù)據(jù)中心產(chǎn)業(yè)帶來的影響。

處理性能大幅升級，滿足更廣泛需求

已宣布上市的至強6900P系列處理器（代號Granite Rapids-AP），具備三個計算單元和兩個I/O單元，最高可配備128個內(nèi)核，支持每秒6400MT的DDR5內(nèi)存、每秒8800MT的MRDIMM內(nèi)存、6條UPI 2.0鏈路（速率高達每秒24 GT），96條PCIe5.0或64條CXL 2.0通道、504MB的L3緩存，支持FP16數(shù)據(jù)格式的英特爾高級矩陣擴展（英特爾AMX），可為AI和科學計算等內(nèi)存帶寬敏感型工作負載提供MRDIMM選擇，且新增對CXL 2.0的支持。

約在2年前，市場上一個主流服務(wù)器所搭配的至強處理器約為24-48核，與之相比，至強6900P最高128個內(nèi)核的配備，大幅提升了CPU內(nèi)核數(shù)量以及整體性能，可以說是“跨越式”的表現(xiàn)。根據(jù)已透露的測試，至強6900P平臺在數(shù)據(jù)庫、科學計算等關(guān)鍵應(yīng)用負載的表現(xiàn)是上一代產(chǎn)品的2.31倍-2.5倍，AI應(yīng)用性能是其1.83倍-2.4倍。

芯片架構(gòu)是至強6性能核處理器的獨特之處，它采用了計算芯片單元與I/O芯片單元解耦的分離式模塊化設(shè)計，以Chiplet的形式封裝在一起。計算單元中包含了x86內(nèi)核、內(nèi)存控制器和緩存。I/O單元中包含了PCle、CXL、UPI等通用協(xié)議，也包括了英特爾獨有的加速器。通過不同的排列組合，使得它可以靈活組合不同數(shù)量的計算單元，實現(xiàn)核心數(shù)量的擴展及內(nèi)存和I/O的同步強化，保證更優(yōu)的整體性能和能效。

在AI加速方面，從第四代至強處理器開始，英特爾就為AI加速推出了專屬指令集——高級矩陣擴展（英特爾AMX）。通過這個指令集，CPU能夠更好地支持大模型推理計算。在最新一代的至強處理器中，該指令集也進行了升級。AI工作負載方面，至強6性能核處理器可運行12種工作負載，覆蓋通用計算、數(shù)據(jù)庫、科學計算等，其中包括Llama2、Llama3 大模型等。

與第五代至強可擴展處理器相比，至強6處理器從64核升級到128核，平均單核性能提升高達1.2倍，平均每瓦性能提升高達1.6倍，同等性能水平下平均節(jié)省30%的TCO。在運行70億參數(shù)Llama2 大模型推理時，在AMX加速的情況下，實現(xiàn)了3.08倍的性能提升。

存力升級，多項新技術(shù)賦能

算力需要平衡的升級，至強6性能核處理器除了核數(shù)多、計算性能提升，在內(nèi)存方面也進行了較大的改進，主要亮點有：

更快的內(nèi)存——MRDIMM。英特爾兩年前就開始和業(yè)界領(lǐng)先廠商就MRDIMM展開合作，目標就是能夠率先在服務(wù)器領(lǐng)域推出支持MRDIMM技術(shù)的服務(wù)器。MRDIMM利用數(shù)據(jù)緩沖區(qū)，實現(xiàn)了兩個列的同步操作，從而允許一次向 CPU 傳輸 128 字節(jié)的數(shù)據(jù)；而傳統(tǒng)DRAM 模塊一次只能傳輸 64 字節(jié)。英特爾至強6性能核處理器，通過使用標配6400MT/s和更快的MRDIMM內(nèi)存結(jié)合的方式，可以處理對內(nèi)存非常敏感的工作負載，包括科學計算、AI等。

更大的內(nèi)存——CXL。至強6在CXL方面的演進同樣值得關(guān)注，第五代至強正式引入CXL 2.0，用以擴展內(nèi)存容量和帶寬。至強6已經(jīng)可以支持3種CXL內(nèi)存擴展模式：CXL Numa Node、CXL Hetero Interleaved、Flat Memory。

從一系列性能規(guī)格就可以看出，新一代至強6性能核處理器在核心數(shù)量、內(nèi)存帶寬、AI加速功能方面明顯升級，這對計算密集型工作負載非常關(guān)鍵，可以覆蓋從邊緣到數(shù)據(jù)中心再到云環(huán)境中的各種AI挑戰(zhàn)。通過采用模塊化SoC架構(gòu)設(shè)計，至強6性能核處理器能夠以豐富的產(chǎn)品系列，為云服務(wù)提供商、OEM、ODM、ISV等提供靈活性和可擴展性。

釋放通用CPU在AI邊緣推理中的價值

作為算力的載體，數(shù)據(jù)中心在過去近20年中，通過不斷的演進與重構(gòu)見證和推動了科技的發(fā)展。如今，在算力需求日益飆升且多樣化的當下，至強6性能核處理器將給數(shù)據(jù)中心帶來哪些獨到價值？又將如何進一步釋放算力價值？

英特爾數(shù)據(jù)中心與人工智能集團副總裁兼中國區(qū)總經(jīng)理陳葆立認為，通用CPU進行AI推理是一個較大的機遇。盡管大模型規(guī)模在不斷增長，但是行業(yè)專用模型可能并不需要如此龐大的模型，對于許多行業(yè)用戶來說，他們實際上更傾向于使用10B以下的行業(yè)專用模型，并在這些模型中構(gòu)建專屬的知識和數(shù)據(jù)庫。根據(jù)一些客戶反饋，至強6性能核處理器進行Llama2、Llama3推理，性能已足夠應(yīng)對。此外，在一些搭載加速器或GPU的AI服務(wù)器中，絕大部分機頭選用的也都是英特爾CPU處理器，英特爾與主流的GPU廠商、AI生態(tài)合作伙伴都建立了良好的合作關(guān)系，共同定義至強規(guī)格以提供最佳的機頭體驗。

新華三集團計算存儲產(chǎn)品線副總裁劉宏程認為，至強6性能核處理器相較于上一代的性能提升并非細微改進，而是翻天覆地的變化，這可能會改變用戶以往“再等等”的觀望心態(tài)，這種顯著的性能增長有望加速整個行業(yè)向新一代技術(shù)切換的進程。

他指出，過去業(yè)界常常用 “通用服務(wù)器”和“GPU服務(wù)器” 來進行區(qū)分，但在這一代服務(wù)器上，實現(xiàn)了融合的基礎(chǔ)設(shè)施，即能夠同時兼顧通用計算和GPU加速的需求。這種融合將加速各行業(yè)對新技術(shù)應(yīng)用的推動，因為用戶不再需要在不同類型的服務(wù)器之間做出選擇，而是可以更加靈活地應(yīng)對多樣化的計算需求。

由于大模型應(yīng)用到具體行業(yè)，往往需要結(jié)合企業(yè)的私有數(shù)據(jù)進行微調(diào)與推理。他認為融合架構(gòu)比單一GPU服務(wù)器更適合這類需求，因為對于私域小規(guī)模的訓練和推理任務(wù)來說，融合架構(gòu)的投資回報率更高，能夠更有效地利用資源。當推理需求成為主要應(yīng)用場景時，至強6性能核處理器憑借出色的推理性能，可能成為一個更加經(jīng)濟高效的選擇。

超聚變服務(wù)器產(chǎn)品總經(jīng)理朱勇談到，面對千行百業(yè)的應(yīng)用，該處理器可以做到“一芯多用”，既可以進行通用計算、又可以做邊緣推理，目前已經(jīng)可以應(yīng)用在10B大模型的推理場景，這給客戶帶來的優(yōu)勢是能夠降低TCO。他強調(diào)，“百模大戰(zhàn)”的終極挑戰(zhàn)就是商業(yè)變現(xiàn)問題，一個AI應(yīng)用的成熟落地離不開模型推理，而基于通用場景的CPU推理，能夠給客戶帶來較大的商業(yè)價值。

寧暢副總裁兼首席技術(shù)官趙雷評價，新一代至強6性能核處理器是英特爾“重回巔峰”之作，讓他覺得英特爾又重新占領(lǐng)、并且拿到了市場的主導(dǎo)權(quán)，給他注入了更大信心。

英特爾市場營銷集團副總裁、中國區(qū)云與行業(yè)解決方案和數(shù)據(jù)中心銷售部總經(jīng)理梁雅莉補充，大模型的投資熱潮仍在持續(xù)，接下來，整個行業(yè)將會關(guān)注如何基于通用大模型發(fā)展行業(yè)特定的大模型，這也意味著AI大模型第二場發(fā)展機遇剛剛開始，且潛力無限。她強調(diào)，對于具體的行業(yè)應(yīng)用來說，推理場景不僅與行業(yè)相關(guān)，而且與每個行業(yè)的具體場景密切相關(guān)。因此，未來算力的需求不僅被極大地放大，而且呈現(xiàn)出多樣化的特點。在這樣的趨勢下，“性能”和“成本”必須是一個平衡考慮，而至強6性能核處理器正是基于對未來趨勢的洞察而誕生的。

推動液冷產(chǎn)業(yè)加速發(fā)展

更強算力也讓數(shù)據(jù)中心面臨能耗和散熱挑戰(zhàn)。立足于此，英特爾發(fā)起了英特爾中國數(shù)據(jù)中心液冷創(chuàng)新加速計劃，希望攜手行業(yè)伙伴突破油類單相浸沒散熱能力有限的技術(shù)難題，進一步推動冷板式液冷整體解決方案驗證，同時還聯(lián)合生態(tài)力量推動UQD互換驗證測試，從技術(shù)創(chuàng)新、構(gòu)建統(tǒng)一行業(yè)標準兩方面“雙管齊下”，降低數(shù)據(jù)中心液冷使用成本、增強可靠性，為液冷技術(shù)的規(guī)?；瘧?yīng)用保駕護航。

聯(lián)想基礎(chǔ)設(shè)施業(yè)務(wù)群服務(wù)器產(chǎn)品部總經(jīng)理周韜分享，基于至強6性能核的聯(lián)想ThinkSystem SC750 V4服務(wù)器，是支持至強性能核的高密度服務(wù)器，主要是采用了聯(lián)想海神的溫水水冷技術(shù)，可以做到100%散熱都可以通過水冷去覆蓋，測試結(jié)果顯示在生物化學、氣象這些應(yīng)用方面都有出色性能。

趙雷談到，隨著CPU算力越來越強，核數(shù)從上一代64核升級到現(xiàn)在128核，它的能耗也相應(yīng)從300瓦增加到500瓦，這也客觀推動了液冷的發(fā)展和快速落地。以往350瓦以下的CPU可以通過風冷解決散熱問題，但新一代CPU則需要更高效的散熱方案，如液冷。這一轉(zhuǎn)變不僅推動了液冷技術(shù)的進步，包括冷板、浸沒式冷卻等，還帶動了整個液冷基礎(chǔ)設(shè)施的發(fā)展。

趙雷強調(diào)，液冷技術(shù)的普及將對電力基礎(chǔ)設(shè)施提出新的要求，因為隨著散熱系統(tǒng)的升級，供電能力可能成為新的瓶頸。因此，電力系統(tǒng)的改進也將成為必要。總的來說，CPU技術(shù)的進步不僅促進了液冷技術(shù)的快速發(fā)展，還將拉動整體基礎(chǔ)設(shè)施的升級優(yōu)化。

奪回數(shù)據(jù)中心主導(dǎo)權(quán)，英特爾新一代CPU“跨越式”升級

處理性能大幅升級，滿足更廣泛需求

存力升級，多項新技術(shù)賦能

釋放通用CPU在AI邊緣推理中的價值

推動液冷產(chǎn)業(yè)加速發(fā)展

相關(guān)推薦

電子產(chǎn)業(yè)圖譜

奪回數(shù)據(jù)中心主導(dǎo)權(quán)，英特爾新一代CPU“跨越式”升級

處理性能大幅升級，滿足更廣泛需求

存力升級，多項新技術(shù)賦能

釋放通用CPU在AI邊緣推理中的價值

推動液冷產(chǎn)業(yè)加速發(fā)展

相關(guān)推薦

電子產(chǎn)業(yè)圖譜

奪回數(shù)據(jù)中心主導(dǎo)權(quán)，英特爾新一代CPU“跨越式”升級

處理性能大幅升級，滿足更廣泛需求