加入星計劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
    • 天河星逸通用算力提升了5倍
    • 國產(chǎn)E級超算神威·海洋之光
  • 推薦器件
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

國產(chǎn)新一代超算“天河星逸”發(fā)布:1597.44萬核心,峰值性能達(dá)620PFLOPS?

2023/12/19
2832
閱讀需 12 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

12月17日消息,據(jù)金羊網(wǎng)報道,本月6日,以“超智融合,算啟新篇”為主題的2023年超算創(chuàng)新應(yīng)用大會在廣州盛大召開。在此次大會上,國家超算廣州中心正式發(fā)布了中心的新一代國產(chǎn)超級計算系統(tǒng)——“天河星逸”。

據(jù)國家超算廣州中心主任盧宇彤介紹,“天河星逸”以應(yīng)用為中心,采用國產(chǎn)先進(jìn)計算架構(gòu)、高性能多核處理器、高速互連網(wǎng)絡(luò)、大規(guī)模存儲等關(guān)鍵技術(shù)構(gòu)建,在通用CPU計算能力、網(wǎng)絡(luò)能力、存儲能力以及應(yīng)用服務(wù)能力等多方面較“天河二號”實現(xiàn)倍增,支持高性能計算、AI大模型訓(xùn)練以及大數(shù)據(jù)分析等多種應(yīng)用場景的需求,將進(jìn)一步提升國家超算廣州中心的多領(lǐng)域應(yīng)用服務(wù)能力,為廣州市、廣東省和粵港澳大灣區(qū)的前沿科技突破、戰(zhàn)略工程建設(shè)、產(chǎn)業(yè)升級轉(zhuǎn)型提供強勁的高端算力與平臺支撐,有力提升廣州市作為國家中心城市和綜合性門戶城市的核心科技創(chuàng)新實力,支持區(qū)域科技經(jīng)濟(jì)社會高質(zhì)量發(fā)展。

國家超算廣州中心副主任陳志廣表示,“天河星逸”采用了最先進(jìn)的超算技術(shù),相比原有系統(tǒng),在通用算力上提升了5倍,并且強調(diào)了應(yīng)用能力的提升,應(yīng)用軟件存在進(jìn)一步發(fā)展的空間。超算互聯(lián)網(wǎng)最終目標(biāo)是實現(xiàn)全國聯(lián)網(wǎng),下一步計劃與深圳超算、無錫超算實現(xiàn)聯(lián)網(wǎng)。

天河星逸通用算力提升了5倍

資料顯示,“天河二號”部署在國家超算廣州中心,它使用了Intel Xeon E5-2692 12核處理器及Xeon Phi 31S1P加速卡,總計擁有312萬個核心,整機(jī)功率也達(dá)到了17808千瓦,理論性能是54.9PFLOPS(5.49億億次),Linpack峰值性能33.86PTFLOPS,從2013年6月份到2016年6月份它的性能都沒有變化,連任了六次TOP500冠軍。

天河二號原本有后期升級計劃,但是2015年美國政府頒布禁令,嚴(yán)禁Intel等公司向中國四家超算中心出口高性能計算芯片,這樣使用Intel Xeon Phi加速卡的天河二號就不能再使用美國公司的高性能芯片了。

2017年9月份,廣州超算中心宣布2017年底前升級天河二號超算系統(tǒng),使用國產(chǎn)加速器Matrix 2000取代原本的Intel Xeon Phi加速器。據(jù)了解,Matrix 2000的整數(shù)架構(gòu)應(yīng)該是ARM,但是矢量單元是國內(nèi)自定義的256bit VFU矢量單元。每個Matrix 2000由128個內(nèi)核組成,頻率為1.2GHz,每周期能執(zhí)行16個雙精度運算,處理器峰值性能為2.45TFLOPS。升級后的天河二號被稱為天河2A,峰值性能從之前的54.9PFLOPS提升到了100PFLOPS左右。

按照官方的說法,“天河星逸”的通用性能相比原有系統(tǒng)(升級后的“天河二號”,即天河2A),在通用算力上提升了5倍,也就是說,“天河星逸”的峰值算力應(yīng)該達(dá)到了約600 PFlop/s(每秒50億億次)。

值得注意的是,在今年11月10日在北京召開的“ChinaSC2023第五屆中國超級算力大會”上,發(fā)布了2023中國高性能計算機(jī)性能TOP100排行榜,其中就披露了排名第一的于2023年在超算中心安裝的“超算中心主機(jī)系統(tǒng)異構(gòu)眾核處理器”性能參數(shù),其CPU核數(shù)達(dá)到15974400核,峰值性能達(dá)620PFLOPS,超過了神威·太湖之光。顯然,這個數(shù)據(jù)符合前面關(guān)于“天河星逸”算力的說法。

今年8月12日,國防科技大學(xué)公布的《國產(chǎn)天河新一代超級計算機(jī)智能計算節(jié)點機(jī)時服務(wù)單一來源談判公告(2023-YKJSJY-F5027)》顯示,“擬采購國產(chǎn)天河新一代超級計算機(jī)智能計算節(jié)點36萬節(jié)點小時的機(jī)時服務(wù),用于測試驗證動態(tài)風(fēng)場計算軟件的功能和性能。擬合作供應(yīng)商:國家超級計算天津中心?!?/p>

對于選擇國家超級計算天津中心為單一供應(yīng)商的理由為:“因項目需要在具備MT3000處理器的國產(chǎn)高性能計算系統(tǒng)上測試驗證動態(tài)風(fēng)場計算軟件環(huán)境,需采購36萬節(jié)點小時的國產(chǎn)高性能計算系統(tǒng)機(jī)時服務(wù)。天津超算主機(jī)系統(tǒng)是天河一號系統(tǒng)(TH-1A)和天河新一代系統(tǒng)(含E級驗證系統(tǒng))。其中,天河新一代系統(tǒng)具備基于MT3000處理器的計算節(jié)點,能夠滿足項目需求,且目前國內(nèi)僅有天津超算能提供基于MT3000處理器的國產(chǎn)高性能計算環(huán)境。因此,本次采購擬采用單一來源的方式進(jìn)行?!?/p>

2018年7月,新華社曾報道稱,由天津超算中心研發(fā)的“國產(chǎn)新一代百億億次超級計算機(jī)——“天河三號”E級原型機(jī)完成研制部署,并順利通過分項驗收。該原型機(jī)系統(tǒng)采用了三種國產(chǎn)自主高性能計算和通信芯片?!彪S后在2019年,進(jìn)一步的報道顯示,“我國百億億次超算‘天河三號’原型機(jī)已為30余家單位完成大規(guī)模并行應(yīng)用測試并逐步開放服務(wù)”。

結(jié)合上述信息來看,傳聞中的具備E級算力的“天河三號”采用的正是國產(chǎn)的MT3000處理器。而此次廣州超算中心發(fā)布的“天河星逸”很可能也是基于MT3000處理器,當(dāng)然也有可能是基于傳聞的Matrix 2000+。目前尚未有關(guān)于MT3000處理器的更進(jìn)一步信息,不過可以肯定的是,其性能相比上一代的MT2000將會帶來大幅的提升。

國產(chǎn)E級超算神威·海洋之光

另外,值得一提的是,相比天河2A性能更為強大的“神威·太湖之光”超級計算機(jī)系統(tǒng),采用了40960個中國自主研發(fā)的“申威26010”眾核處理器,該眾核處理器采用64位自主申威指令系統(tǒng),核心工作頻率1.45GHz,峰值性能3.168萬億次每秒。神威·太湖之光里安裝有40960個這樣的處理器,整體的峰值性能可達(dá)12.5億億次/秒,持續(xù)性能為9.3億億次/秒。

而傳聞中的新一代神威超算——神威·海洋之光(Sunway Oceanlite)將采用全新的申威 SW26010-Pro 處理器,預(yù)計將帶來更為強大的性能。

在今年11月召開的SC23 (International Conference for High Performance Computing, Networking, Storage, and Analysis,是高性能計算、體系結(jié)構(gòu)領(lǐng)域頂級會議)大會上,我國科學(xué)家向世界展示了全新的申威 SW26010-Pro 處理器,性能比上一代提高了四倍。這是我國采用自主指令集(基于 Alpha 進(jìn)行擴(kuò)展),具有完全自主知識產(chǎn)權(quán)的處理器系列產(chǎn)品。

根據(jù)PPT資料顯示,SW26010 pro是SW26010改進(jìn)型,擁有6個核心模塊和 1 個協(xié)議處理單元(PPU)構(gòu)成,每個模塊有1個管理Linux線程的核心(MPE)和64個計算核心,總計384 個內(nèi)核,相比之下上一代的SW26010 只有 4 個核心組,說明SW26010 pro單芯片應(yīng)該有50%的性能提升。

SW26010 Pro處理器的64個(8×8)計算核心網(wǎng)絡(luò)是一個具有256KB L2高速緩存的計算處理單元(CPE)。每個CPE有四個邏輯塊,可以在一對上支持FP64和FP32,在另一對上則可以支持FP16和BF16。

SW26010 Pro中的每個核心模塊上都有一個DDR4-3200內(nèi)存控制器和16 GB內(nèi)存,內(nèi)存帶寬為51.4 GB/秒,因此整個處理器有96 GB主內(nèi)存(相比 SW26010 的 32 GB 實現(xiàn)了顯著提升)和307.2 GB/s帶寬。六個CPE通過環(huán)形互連連接,并有兩個網(wǎng)絡(luò)接口,使用專有互連將它們連接到外部。SW26010 Pro芯片的FP64或FP32精度為14.03 PB,BF16或FP16精度為55.3 PB。

另外,SW26010 Pro的MPE內(nèi)核運行在2.1 GHz(前代產(chǎn)品僅 1.45 GHz),CPW內(nèi)核運行在2.25 GHz,再加上全新 64 位 RISC 微架構(gòu)和系統(tǒng)架構(gòu)的改進(jìn),其 FP64 計算吞吐量也增加了四倍以上。

據(jù)介紹,神威·海洋之光最大的配置超過100000個節(jié)點,共有超過4100萬個核心,分布在大約105個機(jī)柜中,峰值半精度(FP16)性能超過5 Exaflop/s,F(xiàn)P64的理論峰值性能為1.5 exaflops,僅次于美國Frontier超級計算機(jī)。

據(jù)The next platform此前報道稱,如果將神威·海洋之光的規(guī)模擴(kuò)大到120個機(jī)柜,在FP64 pervision下的峰值將達(dá)到1.72 Exaflops,這將超過美國橡樹嶺國家實驗室的1.68 Exaflops的“Frontier”超級計算機(jī)。在160個機(jī)柜的條件下,在FP64的峰值性能將接近2.3 Exaflops,將有望擊敗已經(jīng)安裝完成的美國能源部阿貢國家實驗室的基于英特爾CPU及GPU的新一代超級計算機(jī)“Aurora”,以及正在建設(shè)的美國勞倫斯·利弗莫爾國家實驗室基于AMD MI300芯片的“El Capitan”超級計算機(jī),后兩者的FP64性能都將達(dá)到 2 Exaflops以上。

編輯:芯智訊-浪客劍

推薦器件

更多器件
器件型號 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊 ECAD模型 風(fēng)險等級 參考價格 更多信息
KSZ8863RLLI 1 Microchip Technology Inc DATACOM, LAN SWITCHING CIRCUIT, PQFP48

ECAD模型

下載ECAD模型
$5.09 查看
AD73311ARSZ 1 Analog Devices Inc Single-Channel, 3 V and 5 V Front-End Processor for General Purpose Applications Including Speech and Telephony

ECAD模型

下載ECAD模型
$10.72 查看
KSZ8081MNXIA-TR 1 Microchip Technology Inc DATACOM, ETHERNET TRANSCEIVER, QCC32

ECAD模型

下載ECAD模型
$1.71 查看

相關(guān)推薦

電子產(chǎn)業(yè)圖譜