加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
    • 另起爐灶,沒包袱
    • 更適合小模型
    • AI時(shí)代,RISC-V怎么開拓市場?
  • 推薦器件
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

RISC-V不止替代,更搭A(yù)I

2023/07/31
6210
閱讀需 12 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

從2010至今13年的時(shí)間,RISC-V架構(gòu)已從無人問津變成了能夠挑戰(zhàn)ARM架構(gòu)的最強(qiáng)勇者。究其原因,無外乎開源、自由、簡單等原因,更關(guān)鍵的是隨著經(jīng)濟(jì)逆全球化趨勢凸現(xiàn),中美更存在著貿(mào)易進(jìn)一步脫鉤的可能。有著臺積電、英偉達(dá)等“卡脖子”的前車之鑒,國內(nèi)的半導(dǎo)體廠商芯片工程師愈發(fā)關(guān)注如何針對Arm進(jìn)行“國產(chǎn)替代”,RISC-V逐漸成為“全村的希望”。

不過,“國產(chǎn)替代”終究是在走替代的道路,要想實(shí)現(xiàn)如今ARM那樣成熟的生態(tài),年輕的RISC-V的路還有很長。但正如武俠小說中,主角往往都能在機(jī)緣巧合下獲得傳世法寶或頂級武功秘籍,RISC-V似乎也迎來了它的機(jī)遇——AI時(shí)代。

如果說曾經(jīng)的RISC-V是沿著ARM的道路前行,努力做好“替代”的工作,那AI時(shí)代的RISC-V就獲得了超越ARM的機(jī)會。

RISC-V不止替代,為什么?

另起爐灶,沒包袱

圖源:攝圖網(wǎng)

相對ARM來說,RISC-V擁有的最大優(yōu)勢就是輕量化與開源性。

就輕量化來說,這可能并不算是一個(gè)優(yōu)點(diǎn)。雖然芯片僅能聽懂0與1組成的二進(jìn)制命令(機(jī)器語言),但工程師能指揮芯片完成多種多樣的復(fù)雜計(jì)算并不需要使用這些,而是可以使用類似命令行的文本來控制它,這就離不開建立在芯片之上的各種指令集。

指令集本質(zhì)上是操控芯片執(zhí)行任務(wù)的機(jī)器語言或電信號的集合,每個(gè)指令對應(yīng)著一個(gè)電路,輸入一些電信號,芯片就會返回一些電信號。它可以被分為復(fù)雜指令集CISC(Complex Instruction Set Computer)與精簡指令集RISC(Reduced Instruction Set Computing)。事實(shí)上,無論是復(fù)雜還是精簡,它們之間并無優(yōu)劣之分,只是在面對不同應(yīng)用環(huán)境的時(shí)候會展現(xiàn)出不同的性能表現(xiàn)。例如在執(zhí)行較復(fù)雜命令,對功耗要求不那么高的PC平臺上,屬于CISC的X86指令集幾乎一統(tǒng)天下,而在移動(dòng)端領(lǐng)域,CISC較高的功耗需求,讓屬于RISC的ARM占據(jù)了絕對優(yōu)勢。

不過就RISC-V與其競爭對手ARM而言,他們都屬于RISC指令集的一種,替代ARM,RISC-V優(yōu)勢在哪?

進(jìn)入2023年,AI讓芯片的算力得到無與倫比的表現(xiàn)。作為軟件,AI可以說已經(jīng)榨干了所有芯片的極限。而當(dāng)摩爾定律腳步放緩,硬件成長速度變慢,算力從哪來?突破摩爾定律,RISC-V似乎比ARM更有優(yōu)勢。

目前,面對AI算法對硬件算力的壓榨,實(shí)行專用架構(gòu),或者說對AI算法進(jìn)行特定優(yōu)化的芯片成為化解高算力需求的新趨勢。ARM與X86,作為老牌指令集,它們內(nèi)部有著諸多“陳年代碼”類似的問題——“shit山”,換種文雅的說法就是歷史遺留指令太多,后續(xù)工程師很難再對現(xiàn)有指令進(jìn)行更新或添加。很多讀者或許下載過ARM官方的文檔介紹,幾千頁讀下來,熟練掌握尚且困難,推陳出新更是難辦。多指令模式更為ARM架構(gòu)設(shè)計(jì)增添了復(fù)雜性。因此,在指令集的擴(kuò)展方面,年輕的RISC-V天然具有極大優(yōu)勢。

目前,專用芯片可以分為常規(guī)的CPU、GPU,以及FPGA與ASIC。芯片從CPU到ASIC,專用性依次提升,但通用性也相應(yīng)下降。ASIC作為專用芯片,它甚至只能跑固定算法,不過換來的則是超越所有芯片的運(yùn)行速度與更低的功耗。有數(shù)據(jù)顯示,相對同級別CPU、GPU,該類ASIC芯片可提高運(yùn)算性能15倍至30倍,并提高能耗效率30倍至80倍。不過,目前AI算法還正處于快速迭代中,將算法直接固定下來顯然不劃算。因此,專用性與通用性兩手抓的DSA架構(gòu)與FPGA受到更多的關(guān)注。

2017年,David Patterson與John Hennessy在“體系結(jié)構(gòu)的黃金年代”主題演講中提出了DSA架構(gòu)。相比FPGA,DSA更像是ASIC的升級版或回調(diào)版,而不是FPGA的改進(jìn)。DSA可以為某類應(yīng)用進(jìn)行特定優(yōu)化,實(shí)現(xiàn)更高的能效比。在RSIC-V高靈活性優(yōu)勢的加持下,DSA架構(gòu)還能發(fā)揮出更多優(yōu)勢,其中就包括能耗。從另一方面來說,目前FPGA已經(jīng)較為成熟,已經(jīng)有不少服務(wù)器用上了FPGA,但在新興的邊緣計(jì)算領(lǐng)域,由于對功耗較為敏感,DSA正在獲取更多市場。

總的來說,更“年輕”的RISC-V擁有比ARM和X86更好的靈活性與擴(kuò)展性。在邊緣AI計(jì)算對算力、功耗均有較高要求的條件下,DSA架構(gòu)正在快速發(fā)展,RISC-V作為更靈活的指令集,則更加搭配DSA架構(gòu)。

更適合小模型

圖源:攝圖網(wǎng)

RISC-V并不是適合所有的AI模型。很明顯,在AI大模型方面,由于其需要的極高算力與超高的相關(guān)資源消耗,讓幾乎所有RISC指令集望而卻步。以ChatGPT這類大模型為例,據(jù)OpenAI測算,ChatGPT訓(xùn)練階段總算力消耗約為3640 PF-days(約1PFLOP/s效率跑3640天),GPT-3訓(xùn)練成本預(yù)計(jì)能達(dá)到500萬美元/次。

邊緣AI,無法承載大模型對算力的高需求,瞄準(zhǔn)單一領(lǐng)域、對算力要求相對低的小模型AI則可以施展拳腳,RISC-V的機(jī)會就來了。尤其是物聯(lián)網(wǎng)領(lǐng)域,RISC-V已經(jīng)展現(xiàn)出了優(yōu)勢。前文提到,RISC-V的輕量化帶來靈活性優(yōu)勢,這一點(diǎn)也正好匹配了IOT領(lǐng)域的發(fā)展。2021年,RISC-V芯片數(shù)量已經(jīng)突破10億顆,其中最多應(yīng)用在語音識別、AI視覺、智能家電、工業(yè)控制、物聯(lián)網(wǎng)安全等領(lǐng)域。

從算法角度來說,更高自由度的RISC-V指令集恰好與需要更快速迭代與高算力的AI算法相匹配。墨滴論壇專家表示:“RISC-V的指令集可以根據(jù)具體的應(yīng)用需求進(jìn)行裁剪和定制,因此可以更好地適應(yīng)不同的AI算法,包括深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等。”更重要的是,AI算法,無論是大模型還是小模型,都離不開算力屬性的支持。既要算力高,又要迭代快適應(yīng)廣,更輕更便捷的RISC-V非常適合。

還有一點(diǎn)非常重要,在ARM的絕對優(yōu)勢區(qū)域IP領(lǐng)域,RISC-V還擁有殺手锏。首先,由于RISC-V指令集非常靈活,在設(shè)計(jì)芯片時(shí),單個(gè)IP可以更加靈活的進(jìn)行組合或重構(gòu)(自行增減指令集或者核心數(shù)量),而不是必須遵守ARM的IP協(xié)議,較死板的應(yīng)用高價(jià)買來的IP核。簡單來說,RISC-V的IP相比ARM還能繼續(xù)“拆解”,以解決芯片設(shè)計(jì)的多種情況。同時(shí),這也為RISC-V架構(gòu)帶來了更高的擴(kuò)展性,設(shè)計(jì)師可以像玩樂高積木一樣任意拆分模塊,組合出理想中的芯片來。

總結(jié)一下,如今AI大流行時(shí)代,云端AI模型正逐漸向覆蓋面積更廣闊的邊緣移動(dòng)。高自由度的組合形式為RISC-V帶來更強(qiáng)的靈活性,也更加契合邊緣AI的發(fā)展。

AI時(shí)代,RISC-V怎么開拓市場?

圖源:攝圖網(wǎng)

就ARM或X86的選擇上,一家中小規(guī)模的公司,一旦選擇在某個(gè)指令集上發(fā)力,就要投入大量人力資源去迎合。那么RISC-V怎么從早已成熟的ARM架構(gòu)中搶奪本來就稀缺的芯片人才呢?

記者在南京世界半導(dǎo)體大會上采訪到了時(shí)擎科技董事長蔣壽美。他表示,其實(shí)應(yīng)用RISC-V指令集并不會給芯片設(shè)計(jì)工程師造成很大困難。ARM與RISC-V之間的切換,就像是具有數(shù)據(jù)結(jié)構(gòu)知識的程序員,在C語言與Python之間的切換一樣。變化的只是指令,不變的是整體的設(shè)計(jì)理念。蔣壽美認(rèn)為,一個(gè)熟練掌握ARM架構(gòu)的設(shè)計(jì)師,可能僅需半個(gè)月就能切換到RISC-V的開發(fā)上來。

對于RISC-V來說,AI是個(gè)風(fēng)口,但也埋藏危機(jī)。曾經(jīng)元宇宙與區(qū)塊鏈的概念都紅極一時(shí),不過僅一兩年的時(shí)間過后,很多廠商就已經(jīng)倒閉或撤資,吹起來的泡沫也一一破裂。當(dāng)AI退潮,RISC-V是否在裸泳呢?

就目前來看,AI的浪潮與過去元宇宙和區(qū)塊鏈的爆火并不相同。AI其實(shí)已經(jīng)切實(shí)的提升了整體生產(chǎn)力。更關(guān)鍵的是,AI的發(fā)展并不是一蹴而就,從阿爾法狗戰(zhàn)勝李世石的驚世棋局,再到ChatGPT引發(fā)的另一個(gè)“iPhone時(shí)刻”,AI已經(jīng)高速發(fā)展了很久,它經(jīng)歷了多次互聯(lián)網(wǎng)寒冬,橫跨了多個(gè)爆發(fā)的熱點(diǎn)技術(shù)。記者從多家企業(yè)中了解到,目前很多企業(yè)都將研發(fā)重點(diǎn)押寶AI,尤其是邊緣計(jì)算,包括AI語音、AI視覺甚至AI交互。今天的發(fā)展成果,還遠(yuǎn)不及AI所能達(dá)到的頂點(diǎn)。AI從未止步,RISC-V也未停歇。

總結(jié)

從宏觀角度看,RISC-V的發(fā)展還遠(yuǎn)遠(yuǎn)不及ARM。龐大的生態(tài)體系與眾多的開發(fā)者是RISC-V難以逾越的鴻溝。不過正因如此,RISC-V也具備了更輕量化的指令集,“船小好調(diào)頭”成為AI時(shí)代的重要優(yōu)勢。隨著硬件技術(shù)的發(fā)展,更搭A(yù)I的RISC-V正從替代ARM,一步步走向與ARM并肩前行的未來。

推薦器件

更多器件
器件型號 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊 ECAD模型 風(fēng)險(xiǎn)等級 參考價(jià)格 更多信息
XC7A100T-1FGG676I 1 AMD Xilinx Field Programmable Gate Array, 7925 CLBs, 1098MHz, 101440-Cell, CMOS, PBGA676, FBGA-676

ECAD模型

下載ECAD模型
$1546.16 查看
XC6SLX9-3CSG225I 1 AMD Xilinx Field Programmable Gate Array, 715 CLBs, 862MHz, 9152-Cell, CMOS, PBGA225, 13 X 13 MM, 0.80 MM PITCH, LEAD FREE, BGA-225

ECAD模型

下載ECAD模型
暫無數(shù)據(jù) 查看
A3P125-VQ100I 1 Microchip Technology Inc Field Programmable Gate Array, 3072 CLBs, 125000 Gates, 350MHz, CMOS, PQFP100
$15.73 查看

相關(guān)推薦

電子產(chǎn)業(yè)圖譜

與非網(wǎng)行業(yè)分析師。工科背景,擅長與初創(chuàng)企業(yè)打交道,帶你分析最新行業(yè)政策,解讀新聞背后的故事。