加入星計劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴散
  • 作品版權(quán)保護
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
  • 相關推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

算力時代探尋國產(chǎn)GPGPU破局之路,芯動力高性能高通用性GPGPU

2022/12/01
2256
閱讀需 12 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

數(shù)字經(jīng)濟化時代,算力就是生產(chǎn)力。隨著以算力為核心的科技競爭成為當前大國競爭的戰(zhàn)略焦點,把握算力發(fā)展的重大戰(zhàn)略機遇期就是搶占發(fā)展的主動權(quán)和制高點。

作為新型生產(chǎn)力,算力的迅猛發(fā)展離不開芯片數(shù)據(jù)中心云計算產(chǎn)業(yè)鏈的日臻完善,特別是作為三大算力芯片之一的GPU,更是兵家必爭之地。而由GPU衍生出來的GPGPU憑借并行計算理念打造出強大的高性能通用計算優(yōu)勢,在算力時代正風生水起。

有算力時代繪就的宏偉GPGPU藍圖召喚,有英偉達一飛沖天的傳奇激勵,疊加中國進口替代以及科創(chuàng)板的杠桿效應,資本對GPGPU賽道高度興奮,一眾初創(chuàng)公司亦相繼涌現(xiàn),爭相登高一呼,要在融資、量產(chǎn)、應用層面試比高,也讓這一賽道端得熱鬧非凡。

但要警醒的是,與GPGPU高熱相伴的是圈內(nèi)的浮躁風、套殼風和虛夸風不止。而在波譎云詭的國際形勢面前一系列熱點事件的發(fā)酵,更讓業(yè)界關注國產(chǎn)GPGPU的真實“成色”。穿越GPGPU的重重迷霧,到底該如何解鎖國產(chǎn)GPGPU的真功夫?

補位迫切 國產(chǎn)GPGPU迎來新考驗

經(jīng)過多年的積淀,中國作為算力發(fā)展的“領跑者”,已在算力競逐中走到世界前列。

截至2022年6月,中國數(shù)據(jù)中心機架總規(guī)模超過590萬臺,服務器規(guī)模約2000萬臺,算力總規(guī)模超過150 EFlops,位列全球第二。有機構(gòu)預測到2025年,中國GPGPU市場規(guī)模將達到458億元,相較于2019年的86億元增長5倍多。

但在巨大的市場規(guī)模背后,折射的卻是GPGPU難言的尷尬境地。英偉達、AMD雙雄憑借多年構(gòu)筑的護城河優(yōu)勢,壟斷了中國GPGPU的90%市場。隨著GPGPU應用在云計算、大數(shù)據(jù)、工業(yè)、安防、HPC等市場蔚然成風,無論是中國自身算力的大發(fā)展,還是國產(chǎn)高端大芯片的自主化率提升,國產(chǎn)GPU不能也不應在這一賽道上缺席太久。

加之中美科技戰(zhàn)愈加嚴峻,特別是英偉達禁售A100事件發(fā)生以來,國產(chǎn)GPGPU“替代”之路將不斷加快,如何做強成為新的考驗。

特別是黨的二十大報告也提出,以國家戰(zhàn)略需求為導向,集聚力量進行原創(chuàng)性引領性科技攻關,堅決打贏關鍵核心技術攻堅戰(zhàn)。GPGPU作為國內(nèi)急待突破的高端芯片之一,必然要走上自主化道路。

近幾年國內(nèi)GPGPU公司乘著政策、資本、人才和應用的東風相繼涌現(xiàn),除了一眾老將之外,包括珠海芯動力、壁仞、沐曦、登臨、天數(shù)智芯、紅山微電子、瀚博半導體等新勢力集結(jié)發(fā)力,或在自研架構(gòu)層面的高算力高靈活性發(fā)力;或在生態(tài)打造上可圈可點;或在應用上開疆拓土,在某些特定應用領域也在加快落地。

而在進軍的長征路上,一些急功近利的心態(tài)、大鳴大放的風格也在無形之中對國產(chǎn)GPGPU的發(fā)展產(chǎn)生了阻礙。到底該如何丈量國產(chǎn)GPGPU的“成色”?未來的發(fā)展之路究竟應如何走?

架構(gòu)創(chuàng)新 打造高性能低功耗

作為高端芯片代表,研發(fā)GPGPU顯然是一項極其復雜的系統(tǒng)性工程,涉及硬件架構(gòu)、驅(qū)動開發(fā)、軟件生態(tài)、應用適配等,正是關關難過關關過。

特別是GPGPU需設置大量的計算單元,將大量計算單元進行適當組合并實現(xiàn)極高的計算效率難度極大,而且GPGPU的多元化應用要求GPGPU“兼顧”高算力、低功耗、靈活性,這對底層的核心硬件架構(gòu)提出了更嚴格的要求。

目前國內(nèi)GPGPU廠商的核心架構(gòu)大多自研,這是一條艱難而正確的道路。正如有行業(yè)人士分析稱,走到頂峰的一定是采取自研架構(gòu)的路線,只有能夠把整個架構(gòu)掌握實現(xiàn)自研,才能夠追趕頭部玩家,才有可能在未來進行超越。

珠海市芯動力科技有限公司(簡稱芯動力)創(chuàng)始人李原也指出,為實現(xiàn)大量的計算、流水線的排列方式,需要GPGPU采用大量處理單元陣列的可重構(gòu)計算架構(gòu),這樣才可滿足高算力的需求,同時保持低功耗和硅面積高效。

知行合一,在經(jīng)過長期的摸索和不斷的探索之后,芯動力創(chuàng)新性地開發(fā)了兼顧能效與編程靈活性的可重構(gòu)并行處理器芯片架構(gòu)RPP(可重構(gòu)并行處理器),吹響了向GPGPU進軍的號角。

厚積而薄發(fā),RPP的架構(gòu)優(yōu)勢也十分顯著:支持大量的并行線程,通過采用空間處理器架構(gòu),把RPP指令分發(fā)到空間上不同的PE陣列里面,并按照指令的依賴關系連接起來,當大量數(shù)據(jù)流過PE陣列時,以流水線的方式完成計算。此外,因RPP處理器設計的高效性,可以在同樣的芯片面積上放入更多的片上內(nèi)存,在計算時候可以實現(xiàn)數(shù)據(jù)的最小距離搬運,大大降低功耗,實現(xiàn)了低功耗存算一體化。

(RPP架構(gòu)圖)

整體而言,利用RPP架構(gòu)的優(yōu)越性,可達到更高的算力、更低的功耗,從而降低服務器的部署和運維成本。

在架構(gòu)層面厚積薄發(fā)之后,芯動力乘勝出擊,采用空間流水線架構(gòu)、原生支持CUDA生態(tài)的第一代產(chǎn)品RPP-R8已成功流片,并面向客戶送樣及銷售。

據(jù)悉,RPP-R8除了具備專用芯片所沒有的通用編程性,面積效率比可達到英偉達同類產(chǎn)品的7~10倍,能效比也超過3倍,可滿足高效并行計算及AI計算應用。

兼容主流生態(tài)切入邊緣應用場景

要在GPGPU領域通關,生態(tài)至關重要。而且,GPGPU的生態(tài)非常復雜,要求一路打通到應用層,提供面向應用的全面支持。

因英偉達CUDA生態(tài)盛行,國內(nèi)不少GPGPU初創(chuàng)公司初期大都在走兼容CUDA生態(tài)的道路。在這方面,RPP也以獨有的底層硬件架構(gòu)實現(xiàn)了對CUDA語言的支撐,原生支持CUDA生態(tài)。芯動力自主開發(fā)工具鏈,擁有獨立的SIMT指令集與后端編譯器,在cuDNN與TensorRT上實現(xiàn)了API兼容;支持廣泛AI框架如TensorFlow、Pythorch,。

李原認為,通過兼容CUDA語言,通過自有的指令集和開發(fā)工具進行深度優(yōu)化性能,在高性能計算領域內(nèi)RPP-R8可以得到最廣泛使用的編程語言的支持,不僅從底層的軟件兼容,而且從它的調(diào)用形式、用戶的感知方面也兼容并帶來更好的體驗。

實現(xiàn)兼容之后,芯動力擁有了GPGPU應用之門的“鑰匙”。GPGPU的應用場景廣泛,如何滿足客戶的差異化需求?特別是國產(chǎn)GPGPU實力還相對較弱的情形下,如何走農(nóng)村包圍城市的路線?

“這就要求從客戶的角度來看,幫助客戶解決了什么痛點?而市場需要的是能夠幫助客戶快速的完成他們的產(chǎn)品,也就是Time to Market?!崩钤袛?。

看準這一動向,芯動力謀定而后動。RPP-R8的特點非常適用在高密度數(shù)據(jù)量的邊緣計算場景,因此,芯動力科技選擇從邊緣計算市場如工業(yè)視覺、輔助駕駛、安防等領域切入。

近年來,安防行業(yè)越來越多數(shù)據(jù)從云中心遷移到“邊緣”上,RPP-R8在安防的應用場景中優(yōu)勢也讓芯動力在這一市場斬獲豐實。此外,隨著智能制造業(yè)的智能化需求在不斷提升,芯動力的應用拓展也延伸到了工業(yè)視覺領域,得到了廣泛的認可。

此外,RPP-R8具備的高性能和通用可編程性還可不斷加快客戶Time to Market的步伐。一家采用RPP-R8進行信號處理的客戶直陳說:“RPP-R8芯片對公司的意義不僅僅是一個產(chǎn)品一個項目,而是解決公司長遠問題的一顆芯片。”不僅如此,他們還希望把整個公司的產(chǎn)品都基于RPP-R8芯片來設計使用,這樣就可以從繁瑣而耗時的FPGA硬件開發(fā)中解脫出來,從而得以專心研發(fā)系統(tǒng)軟件和算法,通過使用通用的并行計算芯片,使產(chǎn)品快速上市。

在GPGPU的激蕩歲月,國內(nèi)GPGPU廠商就要選擇一條為客戶創(chuàng)造價值的道路,這樣才能成就自身的價值,才能行穩(wěn)致選。芯動力將這一DNA貫穿于創(chuàng)新、優(yōu)化和應用的全過程,也收獲了新的勢能。

在RPP-R8芯片的應用正在多點開花之際,芯動力對于未來也有了更明確的規(guī)劃。李原表示,市場在迅速地變化,地緣政治的因素對行業(yè)影響非常大,芯動力要能應對這些變化,并在變化之中找到機會。芯動力也將花費更多的時間打磨,無論是架構(gòu)、生態(tài)還是應用層面都要更上一層樓。也希望在今后的發(fā)展過程當中,能夠得到更多的行業(yè)和生態(tài)系統(tǒng)合作伙伴的支持,一起去共同促進國產(chǎn)GPGPU的發(fā)展。

結(jié)語:

在當前充滿競爭且空前復雜的市場形勢之下,國產(chǎn)GPGPU業(yè)的發(fā)展注定是曲折的。

盡管面臨重重險阻,但在國家相關政策及產(chǎn)業(yè)資金的傾斜下,最后的成功唯取決于中國無數(shù)公司的努力,取決于技術的創(chuàng)新,取決于堅持的長久。

還要看到的是,GPGPU的研發(fā)牽一發(fā)而動全身,需要的不僅僅是架構(gòu)迭代與生態(tài)打造,還需要光刻機等配套產(chǎn)業(yè)的同步提升,才能縮短與國際領先水平之間的差距。此外,兼容是捷徑,但不是終點,從長遠來說一定要建立自己的生態(tài)。國內(nèi)GPGPU廠商還應風物長宜放眼量。

無疑,美對我國半導體業(yè)的全面圍剿也將不斷加速國產(chǎn)芯片自主化的進程,但要從弱到強,從低端到高端,顯然是一場以數(shù)年為計的長征之路。

英偉達

英偉達

NVIDIA(中國大陸譯名:英偉達,港臺譯名:輝達),成立于1993年,是一家美國跨國科技公司,總部位于加利福尼亞州圣克拉拉市,由黃仁勛、克里斯·馬拉科夫斯基(Chris Malachowsky)和柯蒂斯·普里姆(Curtis Priem)共同創(chuàng)立。公司早期專注于圖形芯片設計業(yè)務,隨著公司技術與業(yè)務發(fā)展,已成長為一家提供全棧計算的人工智能公司,致力于開發(fā)CPU、DPU、GPU和AI軟件,為建筑工程、金融服務、科學研究、制造業(yè)、汽車等領域的計算解決方案提供支持。

NVIDIA(中國大陸譯名:英偉達,港臺譯名:輝達),成立于1993年,是一家美國跨國科技公司,總部位于加利福尼亞州圣克拉拉市,由黃仁勛、克里斯·馬拉科夫斯基(Chris Malachowsky)和柯蒂斯·普里姆(Curtis Priem)共同創(chuàng)立。公司早期專注于圖形芯片設計業(yè)務,隨著公司技術與業(yè)務發(fā)展,已成長為一家提供全棧計算的人工智能公司,致力于開發(fā)CPU、DPU、GPU和AI軟件,為建筑工程、金融服務、科學研究、制造業(yè)、汽車等領域的計算解決方案提供支持。收起

查看更多

相關推薦

電子產(chǎn)業(yè)圖譜