加入星計劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
    • 25%在售至強(qiáng)被用于AI負(fù)載
    • 第五代至強(qiáng)焦點:AI、每瓦性能、安全性、可部署性……
    • 2024年推出第六代至強(qiáng):P-core和E-core全面覆蓋數(shù)據(jù)中心所需
    • 揭秘全新架構(gòu)設(shè)計過程
    • 至強(qiáng)已可運行200億參數(shù)AI大模型
    • 在加速計算的世界,CPU落伍了嗎?
  • 推薦器件
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

訪英特爾:2024年是數(shù)據(jù)中心x86 CPU發(fā)展拐點

2023/09/27
4445
閱讀需 18 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

數(shù)據(jù)中心等應(yīng)用場景,英特爾至強(qiáng)可擴(kuò)展處理器依然占據(jù)主導(dǎo)地位,該產(chǎn)品進(jìn)展也被業(yè)界所關(guān)注。日前,在美國圣何塞舉行的“2023英特爾on技術(shù)創(chuàng)新大會”上,英特爾副總裁、至強(qiáng)產(chǎn)品和解決方案事業(yè)部總經(jīng)理Lisa Spelman,和英特爾資深院士、至強(qiáng)首席架構(gòu)師Ronak Singhal,接受了<與非網(wǎng)>和全球其他少數(shù)媒體的專訪,就未來至強(qiáng)的架構(gòu)細(xì)節(jié)、在AI時代的創(chuàng)新思路等進(jìn)行了深入分析。

25%在售至強(qiáng)被用于AI負(fù)載

目前,英特爾至強(qiáng)可擴(kuò)展處理器已經(jīng)進(jìn)化到第四代,第五代至強(qiáng)將于今年12月14日(美國時間)發(fā)布。據(jù)Lisa Spelman透露,截止目前,英特爾已經(jīng)與所有領(lǐng)先的云服務(wù)提供商展開合作,打造多元化實例,并保障其基礎(chǔ)設(shè)施的可用性。并且,與英特爾合作的原始設(shè)備制造商也都在大批量出貨。由此可見,英特爾正在大規(guī)模推動第四代英特爾至強(qiáng)可擴(kuò)展處理器的廣泛應(yīng)用。

在第三代至強(qiáng)時,很多性能都是針對多元化工作負(fù)載的,而在此基礎(chǔ)上,英特爾正在持續(xù)創(chuàng)新,特別是增強(qiáng)在人工智能領(lǐng)域的應(yīng)用?!拔覀兪冀K認(rèn)為至強(qiáng)是適用于任何邊緣網(wǎng)絡(luò)、數(shù)據(jù)中心、云等工作負(fù)載的強(qiáng)有力產(chǎn)品,但同時,至強(qiáng)也具備諸多加速器和專業(yè)功能,以滿足人工智能工作負(fù)載的需求,這也日漸成為我們業(yè)務(wù)中越來越重要的一部分”,Lisa Spelman表示。

她透露,根據(jù)與客戶對一些工作負(fù)載、市場需求等分析發(fā)現(xiàn),25%在售的至強(qiáng)被用于人工智能工作負(fù)載。其中,很大一部分是用于推理,一小部分用于訓(xùn)練。此外,許多至強(qiáng)產(chǎn)品還用于在訓(xùn)練或推理之前的一些工作,如數(shù)據(jù)準(zhǔn)備(包括為至強(qiáng)和GPU提供數(shù)據(jù))。未來,英特爾將持續(xù)推動至強(qiáng)系列的創(chuàng)新,以進(jìn)一步增強(qiáng)在人工智能CPU市場的領(lǐng)先性。

第五代至強(qiáng)焦點:AI、每瓦性能、安全性、可部署性……

至強(qiáng)處理器中引入AI加速器不僅意味著成本的變化,更會對產(chǎn)品的空間布局等帶來影響,這并非一件小事。

Lisa Spelman分享,團(tuán)隊內(nèi)部確實對此有過激烈的討論,但最終,大家一致認(rèn)為這個舉措將產(chǎn)生積極的影響,因此也將堅定不移地持續(xù)推進(jìn)。在推動硬件革新的同時,英特爾也將更多精力投入到軟件更新中,以期實現(xiàn)更多指數(shù)級的變革。

關(guān)于即將發(fā)布的第五代至強(qiáng)(代號為Emerald Rapids)進(jìn)展,Lisa Spelman介紹說,現(xiàn)階段正與客戶緊密合作完成測試、并為廣泛的系統(tǒng)應(yīng)用做準(zhǔn)備。值得注意的是,它與上一代Sapphire Rapids使用同一平臺,是英特爾整個產(chǎn)品線歷史上最無縫的升級之一。

在海量數(shù)據(jù)、復(fù)雜數(shù)據(jù)處理等需求下,能源效率已成為現(xiàn)代云計算和數(shù)據(jù)中心高性能服務(wù)器處理器轉(zhuǎn)變設(shè)計的關(guān)鍵因素,也成為衡量處理器性能的重要指標(biāo),這顯然也是至強(qiáng)未來處理器的聚焦方向。

與前代產(chǎn)品相比,第五代至強(qiáng)將會在每瓦性能方面實現(xiàn)很大提升。Lisa Spelman解釋說,人們在談?wù)撔阅軙r,真正關(guān)注的其實是最大利用率,許多數(shù)據(jù)中心并沒有在任何硬件上真正以最大利用率每時每刻去運行。英特爾一直致力于提高不同工作負(fù)載或不同利用率水平下的性能、效率和功耗,這對于大型企業(yè)客戶以及流量變化很大的云服務(wù)提供商客戶來說至關(guān)重要,在多元化場景中的實際數(shù)據(jù)比產(chǎn)品的書面峰值數(shù)據(jù)更有價值。

此外,第五代至強(qiáng)還將進(jìn)一步推進(jìn)安全功能,比如持續(xù)擴(kuò)大可信執(zhí)行環(huán)境的覆蓋范圍。作為機(jī)密計算的服務(wù)基礎(chǔ),這將更有助于增強(qiáng)硬件的安全性。該功能在第四代至強(qiáng)中面向一些頂級云服務(wù)商提供,第五代產(chǎn)品中則將推向整個市場。

下一代至強(qiáng)的關(guān)注重點還有可部署性。英特爾致力于讓所有數(shù)據(jù)中心客戶都能快速部署該產(chǎn)品,同時適用于上一代平臺的通用軟件堆棧。在具備這一優(yōu)勢的基礎(chǔ)上,升級將非常便捷。再從技術(shù)的角度來看,客戶將擁有更快的傳輸、更大的緩存等,所有這些改進(jìn)都將為廣泛的工作負(fù)載帶來良好的性能提升。例如針對人工智能工作負(fù)載非常注重的內(nèi)存帶寬,第五代至強(qiáng)Emerald Rapids將通過支持DDR 5以滿足其需求。

2024年推出第六代至強(qiáng):P-core和E-core全面覆蓋數(shù)據(jù)中心所需

在最近的Hot Chips上,我們注意到至強(qiáng)處理器引入了新的體系結(jié)構(gòu):Granite Rapids(性能核/P-core產(chǎn)品)和Sierra Forest(能效核/E-core產(chǎn)品)或?qū)⑹堑诹翉?qiáng)最重要的更新。

隨著客戶用例和應(yīng)用程序的日益多元化,對硬件基礎(chǔ)設(shè)施也提出了不同需求,至強(qiáng)正是致力于通過核心數(shù)量、功率、能耗等變化,來滿足市場和客戶實際工作負(fù)載需求。英特爾將引入下一代代號為“Birch Stream”的創(chuàng)新平臺,該平臺支持兩種不同類型的至強(qiáng)處理器:其一是Granite Rapids,也就是第四代至強(qiáng)(Sapphire Rapids)、第五代至強(qiáng)(Emerald Rapids)再向后的產(chǎn)品迭代,Granite Rapids會作為典型的至強(qiáng)產(chǎn)品演進(jìn),誕生出下一代P-core性能核處理器,將繼續(xù)主要圍繞內(nèi)存、核數(shù)、I/O等進(jìn)行產(chǎn)品升級。

值得注意的是,關(guān)于Granite Rapids的產(chǎn)品升級有兩個要點:一是如何增強(qiáng)算力。其中最重要的是在第四代至強(qiáng)基礎(chǔ)上增加了核數(shù),以及繼續(xù)提高能效。因為進(jìn)行大量AI矩陣計算時,耗電量會大幅提升,提升產(chǎn)品能效會直接改善性能底線。將AMX集成至處理器進(jìn)一步加強(qiáng)了的產(chǎn)品競爭力。二是內(nèi)存帶寬。部分AI工作負(fù)載以計算為核心,因此將受到核數(shù)和能效的影響。還有部分大語言模型,需要處理包括計算、存儲等AI工作負(fù)載,因此對內(nèi)存帶寬亦提出了要求。

其二是明年將推出的第一款基于E-core能效核的產(chǎn)品,與Granite Rapids相比,Sierra Forest的核心更節(jié)能,且面積較小,因此,可以在相同功耗下進(jìn)行擴(kuò)展、并增加核數(shù),最高可達(dá)288核。

也就是說,針對數(shù)據(jù)中心日益豐富的工作負(fù)載和用例類型,英特爾將通過性能核(P-core)對計算密集型和AI工作負(fù)載進(jìn)行優(yōu)化,能效核(E-core)則將針對高密度和橫向擴(kuò)展工作負(fù)載的能效進(jìn)行優(yōu)化。

揭秘全新架構(gòu)設(shè)計過程

打磨一款好產(chǎn)品需要足夠的時間周期,那么,英特爾是如何預(yù)判人工智能對數(shù)據(jù)中心處理器帶來的挑戰(zhàn)?在設(shè)計至強(qiáng)產(chǎn)品路線圖時,又有哪些主要的考慮因素?

據(jù)透露,英特爾幾年前就決定將加速人工智能計算的能力嵌入到至強(qiáng)的每個核心中。Ronak Singhal表示,這樣做的好處就是,之前的幾代產(chǎn)品和競爭對手相比,性能均得到顯著提升,并且英特爾將在此基礎(chǔ)上持續(xù)創(chuàng)新,這是至強(qiáng)產(chǎn)品路線圖的核心考慮因素。也正是如此,第四代至強(qiáng)(Sapphire Rapids)在工作負(fù)載的廣度和深度方面都得到了極大拓展。

Ronak Singhal分享,在長期傾聽客戶反饋的過程中,英特爾發(fā)現(xiàn)有一個相同的疑問,即:為什么x86與Arm相比,效率如此低下?他解釋說,事實并非如此,因為指令集架構(gòu)并不是決定效率的因素,而是構(gòu)建產(chǎn)品的方式。當(dāng)Sierra Forest推出后,相信業(yè)界會看到它領(lǐng)先的性能和密度。

以核心數(shù)為例,誰最需要超大量的核心數(shù)?云服務(wù)提供商們正在嘗試將盡可能多的用戶整合到一個系統(tǒng)上,因為這能幫助他們減少所需的系統(tǒng)數(shù)量,從而降低TCO,大核數(shù)的CPU(Sierra Forest)正好可以幫助他們;如果他們需要每個核心擁有最佳性能,他們則可以選擇Granite Rapids。這兩者是相輔相成的。

再從部署能力來看,如果客戶需要投資構(gòu)建平臺,但遲遲無法決定是50%的Granite Rapids加50%的Sierra Forest?還是一方為0,一方為100%?亦或是完全混合?他指出,一切最終由具體的工作負(fù)載或最終客戶來決定,未來的至強(qiáng)可以提供足夠的靈活性,不僅平臺相同,核心之外的其他SoC也相同,這將帶來非常高的靈活度。

打造未來的數(shù)據(jù)中心處理器本身就是一項艱巨而復(fù)雜的任務(wù),而英特爾還打算明年推出兩款CPU,看似是一件挑戰(zhàn)加倍的事。

談及新產(chǎn)品的構(gòu)建過程,Ronak Singhal表示一是基于 chiplet(芯粒)的方式,二是讓兩款處理器盡量共享更多的設(shè)計。從下圖可知,頂部和底部的chiplet,就是我們所說的I/O chiplet,包括 PCIe、CXL 等。這些功能在 Sierra Forest 和 Granite Rapids 之中都很常見。英特爾不會對這些功能以及安全性或可靠性進(jìn)行區(qū)分和更改,不同產(chǎn)品的區(qū)別在于所使用的核心,以及根據(jù)密度和每核性能所擁有的擴(kuò)展能力。


產(chǎn)品的核數(shù)實際上就是集合多少個chiplet,可以根據(jù)實際需求,采用更多或更少的chiplet,來擴(kuò)大或減少核心數(shù)量。顯然,chiplet的方式既實現(xiàn)了構(gòu)建芯片的靈活性,同時也有助于提升制造能力,可以是組合不同類型或是不同尺寸大小的chiplet。

此外,EmiB封裝(英特爾的2.5D先進(jìn)封裝技術(shù))也發(fā)揮了重大作用。通過EmiB封裝,多個獨立的計算chiplet和I/O chiplet,在單一芯片中進(jìn)行了集成,使得芯片結(jié)構(gòu)更為靈活,實現(xiàn)了通用IP、固件、操作系統(tǒng)、平臺的有機(jī)整體。

內(nèi)存方面,英特爾優(yōu)化了DDR5內(nèi)存速度,并將首次支持名為MCR的新內(nèi)存技術(shù),能以與DDR5相同的形態(tài)和互連方式,支持更高的內(nèi)存帶寬,并在HPC和AI等領(lǐng)域發(fā)揮價值。

“這一切功能都將在Sierra Forest和Granite Rapids上共同實現(xiàn)。因此,我認(rèn)為明年將是基于該產(chǎn)品組合的數(shù)據(jù)中心發(fā)展拐點”,Ronak Singhal表示。

至強(qiáng)已可運行200億參數(shù)AI大模型

最新的關(guān)于第四代至強(qiáng)與競品的實測數(shù)據(jù)顯示,至強(qiáng)性能比第四代至強(qiáng)發(fā)布時得到了進(jìn)一步提高。Lisa Spelman表示,這主要是得益于在軟件方面的努力,軟硬結(jié)合可以更好地解鎖性能。

大約6個月前,英特爾開始在至強(qiáng)上分析和研究生成式AI,當(dāng)時可以在50億或70億參數(shù)的大模型上實現(xiàn)較好的TCO和效率,通過采用一些框架、對軟件進(jìn)行調(diào)整和優(yōu)化后,這個數(shù)字提升到了100億。而現(xiàn)在,至強(qiáng)的能力已經(jīng)接近200億參數(shù)的AI大模型,據(jù)透露,當(dāng)前英特爾實驗室正在研究300億參數(shù)AI大模型的運行。

“我們努力在2024年想要實現(xiàn)的目標(biāo),包括提供針對計算密集型工作負(fù)載的產(chǎn)品,以及針對生成式AI的卓越性能,從而抓住市場機(jī)遇,滿足客戶的真實需求”, Lisa Spelman強(qiáng)調(diào)。

在加速計算的世界,CPU落伍了嗎?

在AI的風(fēng)口之下,特別是隨著生成式AI迅速占據(jù)業(yè)界頭條,采用加速計算顛覆傳統(tǒng)數(shù)據(jù)中心的呼聲越來越高。<與非網(wǎng)>在采訪中提出:以英偉達(dá)為例,就在大力倡導(dǎo)并率先進(jìn)軍加速計算數(shù)據(jù)中心。英特爾是如何看待加速計算的?對CPU層面又有哪些影響?

Ronak Singhal表示,AI的發(fā)生不僅在各類加速器上,更在我們“老生常談”的CPU上。實際上,眼下大部分的推理工作都是在CPU上運行的,也可以說是每個工作負(fù)載都將嵌入一部分AI工作負(fù)載,這意味著每次運行任何工作時,幾乎都需要CPU進(jìn)行處理。

“我們始終相信CPU上的推理是非常有價值的,也是極其普遍的。為了讓其在CPU上運行,我們需要繼續(xù)討論‘加速’。我們一直在探索,如何去提高CPU的能力,使它始終是運行這些推理工作負(fù)載的最佳載體。當(dāng)然這并不意味著沒有加速器施展拳腳的空間。對于那些需要專門加速器的任務(wù),還是會由加速器來運行”,他補(bǔ)充,“根據(jù)我們眼下所觀察到的一切,包括算法的發(fā)展方向以及實際案例來看,在CPU上運行AI工作負(fù)載擁有顯著優(yōu)勢,包括更低的延遲以及更高的能效。想象一下,來回在CPU和加速器之間移動數(shù)據(jù)造成的能耗,我認(rèn)為避免這種數(shù)據(jù)傳輸可以極大地降低能源消耗,這也是CPU的一個顯著優(yōu)勢。”

Lisa Spelman則強(qiáng)調(diào),英特爾對目前所擁有的針對AI的CPU硬件產(chǎn)品路線圖感到非常滿意,根據(jù)眾多客戶反饋來看,他們正朝著一個正確的方向去挖掘產(chǎn)品特性和定位產(chǎn)品。

此外,她強(qiáng)調(diào)了AI時代軟件的重要性。顯然,英特爾正在把越來越多的精力轉(zhuǎn)向軟件,這是因為硬件固然非常重要,但也需要在軟件方面努力,以便讓整個市場更容易、更便捷地獲取、利用CPU的能力。例如Oracle數(shù)據(jù)庫之類的標(biāo)準(zhǔn)應(yīng)用,也是花了數(shù)年時間來構(gòu)建生態(tài)系統(tǒng),以確保每一代產(chǎn)品用戶都能充分利用到產(chǎn)品性能。

此外,可部署性也是未來構(gòu)建AI生態(tài)的關(guān)鍵。對于云服務(wù)商、高性能計算中心來說,他們往往擁有足夠的人才和技術(shù),可以很好地解決問題并部署AI。但是對于一些對大模型有巨大需求的企業(yè)或網(wǎng)絡(luò)運營商來說,整合更多消費級的軟件對他們來說非常重要,不論他們是用于構(gòu)建自己的數(shù)據(jù)中心,還是將其作為基礎(chǔ)設(shè)施的一部分去提供服務(wù)。

基于上述原因,Lisa Spelman表示,英特爾在軟件方面投入了大量精力,這對于至強(qiáng)以及英特爾來說可以算是“標(biāo)準(zhǔn)操作”了。英特爾希望通過構(gòu)建強(qiáng)大的生態(tài)系統(tǒng),讓下一代技術(shù)更好地服務(wù)產(chǎn)業(yè)。

此外,英特爾正在擴(kuò)大組織規(guī)模,以及通過各種不同的方式與客戶進(jìn)行合作,這使其夠進(jìn)行一些很有意義的客戶對話,譬如探討大家是如何看待市場的、英特爾可以在哪方面匹配他們的基礎(chǔ)設(shè)施,以及了解一些大客戶如何調(diào)整他們的基礎(chǔ)設(shè)施等等,來更好地匹配英特爾的未來產(chǎn)品。

推薦器件

更多器件
器件型號 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊 ECAD模型 風(fēng)險等級 參考價格 更多信息
ATMEGA64A-AUR 1 Microchip Technology Inc IC MCU 8BIT 64KB FLASH 64TQFP

ECAD模型

下載ECAD模型
$5.79 查看
SAK-XC164CS-16F40FBB 1 Infineon Technologies AG Microcontroller, 16-Bit, FLASH, 40MHz, CMOS, PQFP100, 0.50 MM PITCH, GREEN, PLASTIC, TQFP-100
暫無數(shù)據(jù) 查看
ATMEGA128A-MU 1 Atmel Corporation RISC Microcontroller, 8-Bit, FLASH, AVR RISC CPU, 16MHz, CMOS, 9 X 9 MM, 1 MM HEIGHT, 0.50 MM PITCH, GREEN, MO-220VMMD, QFN-64

ECAD模型

下載ECAD模型
$5.69 查看
英特爾

英特爾

英特爾在云計算、數(shù)據(jù)中心、物聯(lián)網(wǎng)和電腦解決方案方面的創(chuàng)新,為我們所生活的智能互連的數(shù)字世界提供支持。

英特爾在云計算、數(shù)據(jù)中心、物聯(lián)網(wǎng)和電腦解決方案方面的創(chuàng)新,為我們所生活的智能互連的數(shù)字世界提供支持。收起

查看更多

相關(guān)推薦

電子產(chǎn)業(yè)圖譜

與非網(wǎng)資深行業(yè)分析師。主要關(guān)注人工智能、智能消費電子等領(lǐng)域。電子科技領(lǐng)域?qū)I(yè)媒體十余載,善于縱深洞悉行業(yè)趨勢。歡迎交流~