加入星計劃,您可以享受以下權益:

  • 創(chuàng)作內容快速變現
  • 行業(yè)影響力擴散
  • 作品版權保護
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
    • 云端AI大爆發(fā),國產芯片“水漲船高”
    • 大模型訓練國產替代,難在哪里?
    • 國產芯片是否有追趕的可能性?
    • 寫在最后
  • 推薦器件
  • 相關推薦
  • 電子產業(yè)圖譜
申請入駐 產業(yè)圖譜

云端AI好生意,但留給國產芯片的時間不多了

2023/05/05
5752
閱讀需 10 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

寒武紀近日發(fā)布了2023年第一季度報告,顯示營收0.75億元,較上年同期增長19.52%,較上年同期虧損收窄11.26%。甚至在五一前夕,寒武紀總市值達到1034.48億元,這也是時隔兩年半多,寒武紀再破千億大關。

云端AI大爆發(fā),國產芯片“水漲船高”

從寒武紀2022年年報來看,營業(yè)收入較上年同期增加798.93萬元,同比增長 1.11%。其中,云端收入大幅增長,云端產品線收入2.19億元,較上年同期增長173.52%。寒武紀公告稱,隨著云端產品線思元290、思元370系列產品在多家頭部企業(yè)完成產品導入,帶動了云端產品線業(yè)務收入大幅增長。

隨著以ChatGPT為代表的AIGC相關應用涌現,AI相關概念股也持續(xù)上漲。寒武紀作為國內AI算力芯片龍頭,也迎來了上市以來最大的風口。

從2月中下旬開始,ChatGPT逐漸引爆了訓練需求。某企業(yè)人士透露,其公司去年年末主要都是針對小模型訓練做的預算,約不到3000萬。但經過3月份對大模型應用需求的調研后,已經增加了9000萬預算。

市場需求之旺盛可見一斑。那么,寒武紀為此做好準備了嗎?

寒武紀云端產品線的產品形態(tài)主要包括云端智能芯片和加速卡、訓練整機及智能計算集群,而這基本是英偉達的領地。

圖:寒武紀主要產品線(來源:公司公告)

據了解,思元370芯片及加速卡目前與多家頭部互聯網企業(yè)在視覺、語音、圖文識別、自然語言處理等場景下完成了適配工作后,已經進入批量銷售環(huán)節(jié),實現了收入突破。

對于大模型領域,寒武紀公告稱:與某互聯網企業(yè)進行了大模型訓練的初步合作,目前仍處于技術探索和測試階段。

大模型訓練國產替代,難在哪里?

3月中旬,有市場消息稱,百度“文心一言”將調用超大規(guī)模算力,并嘗試使用寒武紀思元590替代部分英偉達A100。

這一消息后來被寒武紀所辟謠。然而,根據所傳出的疑似百度內部的消息是:“除了英偉達A100和寒武紀思元590,其他性能差一點的替代品也考慮?!?/p>

據了解,思元590是寒武紀最新一代云端智能訓練芯片,該產品目前尚未正式發(fā)布。寒武紀董事長陳天石在一次大會中介紹,思元590采用MLUarch05全新架構,實測訓練性能較在售旗艦產品有大幅提升,能夠提供更大的內存容量和更高的內存帶寬,其I/O和片間互聯接口也較上代實現大幅升級。

雖然還未正式上市,但思元590已然被寄予厚望,甚至被認為“將是最早實現商業(yè)應用的接近英偉達A100性能的國產Al訓練芯片”。

寒武紀和百度雙方均未對合作細節(jié)做出正式回應,或許存有這樣的可能性:思元590在“文心一言”中可能小規(guī)模部署進行測試,比如用于推理應用中的小部分場景,進入大模型訓練中的可能性或許并不大。

其實,在性能達到要求的前提下,國產芯片所能實現的成本優(yōu)勢,以及從防止“斷供”、“卡脖子”的戰(zhàn)略意義層面來看,都有其發(fā)展空間和必要性所在。在與一位業(yè)內人士的對話中,問其:如果英偉達A100的庫存用完了,國內企業(yè)寧愿買“閹割版”的芯片,也不會買國產芯片嗎?對方答:“如果國產算力芯片整體性價比能夠達到英偉達的60%-70%,就有購買的意愿,可惜目前還達不到。”

對于大模型訓練所需的算力芯片,業(yè)內認為“只有英偉達的A100和A800能夠真正跑起來,國產GPU只能做小規(guī)模和中規(guī)模的訓練和推理?!?/p>

那么,國產芯片的差距主要在哪?

一位業(yè)內人士認為,在性能提升的基礎上,國產芯片的穩(wěn)定性還需要時間去打磨。以大模型訓練為例,通常進行一次訓練需要幾天甚至十幾天的時間,穩(wěn)定性必須足夠好。因為訓練過程中,需要保存模型參數,以便進行推理及中斷后再訓練使用。如果穩(wěn)定性不好,出現一兩個節(jié)點的宕機,或是個別計算節(jié)點失效,那么就要推翻重來,導致訓練時間延長。

而穩(wěn)定性取決于配套的軟件和工程能力。由于運行過程中,需要解決很多BUG,還需要軟硬件結合、冗余的機制等等,而這些都需要付出相應的時間和成本,也免不了商業(yè)應用中前期的投入和磨合。

此外,英偉達在云端AI訓練生態(tài)領域已布局多年,用戶遷移到國產芯片,需要付出一定的代碼工作量和移植成本,這也是國內芯片企業(yè)的最大瓶頸。

面對云端這個巨大的市場,英偉達方面也絲毫沒有松懈。即使面臨美國商務部以安全問題為由,禁止其向中國客戶出售A100和更先進的H100的情況下。針對禁令,英偉達面向中國市場先后推出了“合規(guī)版”的A800和H800,在關鍵參數方面(如:數據傳輸速率、所支持的內存帶寬)進行了一定下調,以符合出口管制要求。

據傳,在英偉達A100停售前,國內多家企業(yè)都進行了囤貨。且?guī)准翌^部互聯網企業(yè)都向英偉達下了1.5萬-1.6萬的A800和H800訂單,每家金額在十幾億美元左右,大約能保證在2024年有足夠的產能。

國產芯片是否有追趕的可能性?

一份來自阿伯丁大學、MIT等機構的研究,將算力演進劃分為三個階段:前深度學習時代、深度學習時代、大規(guī)模時代。該研究顯示,在過去12年間(2010-2022年),ML訓練算力增長了100億倍。2010 年之前,訓練所需的算力增長符合摩爾定律,大約每20個月翻一番。自2010年代初深度學習問世以來,訓練所需的算力快速增長,大約每6個月翻一番。而到了2015年末,隨著大規(guī)模ML模型的出現,訓練算力的需求提高了10到100倍,一種新的趨勢出現了。

根據OpenAI 近日的分析顯示,自 2012 年以來,AI訓練任務中使用的算力,目前每3.5個月翻一倍。

大模型的“大”體現在海量參數訓練,而這意味著需要極致算力。由于模型越大、參數越多,對算力的需求也更大。這無疑加劇了算力芯片的迭代速度。通常來講,算力芯片折舊時間最長不超過5年,一般為2-3年,在強力需求的推進下,這一市場競爭會更為激烈。

對于企業(yè)用戶來講,追求大算力、高性能的芯片無可厚非,迭代跟不上需求的產品只能從業(yè)務中剝離。特別是對于AI云端訓練這種高門檻的應用,注定難以百花齊放,而會成為寡頭壟斷的領域。對于國內芯片企業(yè)來說,既需要解決生態(tài)問題,又需要實現良好的性價比和穩(wěn)定性,才能讓企業(yè)有替代意愿。

那么,國產算力芯片還有追趕的可能性嗎?

一位業(yè)內人士認為,差距在一點點縮小,但是縮小的難度會越來越大。因為硬件迭代投入是巨大的,量產風險也很高,如果沒有雄厚的資金持續(xù)投入,實現追趕首先有一定的難度。其次,如果英偉達保持現有的產品發(fā)布節(jié)奏,對于國內廠商來講,差距可能會慢慢增大,特別是在相關禁令約束的情況下。

寫在最后

一顆芯片背后,不僅僅是一顆芯片,是長達數十年的平臺耕耘,包括軟硬件平臺、應用框架等等。

頂著“國產AI芯片第一股”頭銜上市的寒武紀,面向的是AI未來的星辰大海,以及國產替代的廣闊前景。但是,在云端這個極需自己“卷”自己的市場中,寒武紀正處于一場看似曙光在即、但仍遙遙無期的長跑中。

不僅是寒武紀,對于所有AI芯片廠商來說都是如此,只有擴大規(guī)模效應、提升營收高速增長,同時,提升項目落地交付速度、降低耗費成本,才有望打破這種“增收仍虧損”的死循環(huán),實現真正的追趕甚至超越。

推薦器件

更多器件
器件型號 數量 器件廠商 器件描述 數據手冊 ECAD模型 風險等級 參考價格 更多信息
ATXMEGA64D3-MH 1 Microchip Technology Inc IC MCU 8BIT 64KB FLASH 64QFN
$13.15 查看
ATMEGA128A-MU 1 Atmel Corporation RISC Microcontroller, 8-Bit, FLASH, AVR RISC CPU, 16MHz, CMOS, 9 X 9 MM, 1 MM HEIGHT, 0.50 MM PITCH, GREEN, MO-220VMMD, QFN-64

ECAD模型

下載ECAD模型
$5.69 查看
ATXMEGA256A3U-AUR 1 Atmel Corporation RISC Microcontroller, 16-Bit, FLASH, AVR RISC CPU, 32MHz, CMOS, PQFP64, 14 X 14 MM, 1 MM THICKNESS, 0.80 MM PITCH, GREEN, PLASTIC, MS-026AEB, TQFP-64
$7.71 查看
寒武紀

寒武紀

寒武紀提供云邊端一體、軟硬件協(xié)同、訓練推理融合、具備統(tǒng)一生態(tài)的系列化智能芯片產品和平臺化基礎系統(tǒng)軟件。寒武紀產品廣泛應用于服務器廠商和產業(yè)公司,面向互聯網、金融、交通、能源、電力和制造等領域的復雜 AI 應用場景提供充裕算力,推動人工智能賦能產業(yè)升級。

寒武紀提供云邊端一體、軟硬件協(xié)同、訓練推理融合、具備統(tǒng)一生態(tài)的系列化智能芯片產品和平臺化基礎系統(tǒng)軟件。寒武紀產品廣泛應用于服務器廠商和產業(yè)公司,面向互聯網、金融、交通、能源、電力和制造等領域的復雜 AI 應用場景提供充裕算力,推動人工智能賦能產業(yè)升級。收起

查看更多

相關推薦

電子產業(yè)圖譜

與非網資深行業(yè)分析師。主要關注人工智能、智能消費電子等領域。電子科技領域專業(yè)媒體十余載,善于縱深洞悉行業(yè)趨勢。歡迎交流~