加入星計劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴散
  • 作品版權(quán)保護
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
    • “從智能汽車到機器人,大模型想象空間巨大”
    • “未來汽車將有很多智能體,各自擅長不同的能力”
    • “智能駕駛往后發(fā)展,降本將是重要趨勢”
    • “整車廠邁向通用人工智能,商湯絕影希望成為核心供應(yīng)商”
  • 推薦器件
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

商湯科技聯(lián)合創(chuàng)始人王曉剛:AGI重塑智能汽車,今明兩年是關(guān)鍵窗口期

05/08 11:20
1716
閱讀需 38 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

對話 |?蓋世汽車CEO、蓋世汽車資訊部總編?周曉鶯

撰文 |?蓋世汽車編輯 熊薇

2022年底ChatGPT火爆出圈,在全球范圍內(nèi)引發(fā)一輪通用人工智能(AGI)技術(shù)創(chuàng)新和產(chǎn)業(yè)化落地熱潮。作為其中一個重要落地場景,汽車產(chǎn)業(yè)憑借智能化變革新機遇,與廣泛市場需求,也站上了“大模型+”風口。

“對于汽車行業(yè),我覺得AGI的影響主要有兩個方面:第一,會大幅提升生產(chǎn)效率,比如基于大模型的端到端自動駕駛,將顯著提升自動駕駛開發(fā)效率;第二,AGI會改變人機交互方式,得益于大模型加持,未來汽車有望變?yōu)橐粋€超級智能體?!苯眨虦萍悸?lián)合創(chuàng)始人、首席科學(xué)家、絕影智能汽車事業(yè)群總裁王曉剛接受蓋世汽車CEO周曉鶯采訪時表示。

尤其是今明兩年,在王曉剛看來將是AGI重塑智能汽車非常關(guān)鍵的時間窗口。

因此,憑借在人工智能領(lǐng)域的豐富積累,以及在AGI軟硬件基礎(chǔ)設(shè)施上持續(xù)不斷的投入,以商湯絕影作為核心載體,商湯正大力布局汽車業(yè)務(wù),并構(gòu)建了完整的“駕-艙-云”三位一體架構(gòu)體系,多維度助推智能汽車加速駛?cè)階GI時代。

智能駕駛領(lǐng)域,商湯絕影早在2022年底就于業(yè)內(nèi)率先發(fā)布了感知決策一體化自動駕駛通用模型UniAD。在此基礎(chǔ)上,依托應(yīng)用場景更廣、性能更強的多模態(tài)大模型,商湯絕影又研發(fā)了新一代自動駕駛大模型 DriveAGI,開啟自動駕駛迭代升級新范式。

智能座艙領(lǐng)域,商湯絕影也發(fā)布了一系列基于多模態(tài)場景大腦的大模型產(chǎn)品,計劃基于多模態(tài)大模型進一步打造AI智能體,更好地助力智能座艙。比如前段時間上市的小米SU7,就應(yīng)用了商湯的大語言模型和多模態(tài)模型。

據(jù)王曉剛介紹,在智駕方面,目前商湯絕影已成功交付了廣汽、合眾、一汽等車企項目,智能座艙業(yè)務(wù)去年更是累計交付了40多個車型,量產(chǎn)規(guī)模大概有120多萬輛,預(yù)計今年無論交付車型款數(shù)還是量產(chǎn)車數(shù)量將再創(chuàng)新高。

不過,盡管AGI在賦能各行各業(yè)轉(zhuǎn)型升級方面已經(jīng)取得了突破性進展,王曉剛認為,大模型要真正在千行百業(yè)產(chǎn)業(yè)化落地,既是短跑又是長跑。“因為我們處在市場和技術(shù)都高速發(fā)展的階段,另一方面,通用人工智能的上限和天花板很高,現(xiàn)在遠沒達到上限,未來還有非常大的發(fā)展空間?!?/p>

那么,AGI重構(gòu)汽車產(chǎn)業(yè),“奇點”究竟何時來臨?需要具備哪些條件?目前商湯絕影已經(jīng)發(fā)展到了哪個階段?后續(xù)還有何長遠的規(guī)劃以及目標?汽車行業(yè)“百模大戰(zhàn)”還會持續(xù)多久?

以下為訪談實錄? 對話

“從智能汽車到機器人,大模型想象空間巨大”

Q:周曉鶯:商湯怎么看待AGI對汽車產(chǎn)業(yè)帶來的影響?

王曉剛:AGI和大模型給人們的社會生活,包括各行各業(yè)帶來了非常深刻的變化。在人工智能1.0時代,我們需要針對每個任務(wù)訓(xùn)練一個模型,在過去幾年里,商湯推出了超過4萬個商業(yè)化模型,這里面投入的研發(fā)資源非常大,研發(fā)周期非常長。但今天有了通用人工智能,幾個非常強的大模型就可以完成很多任務(wù),而且是一些開放式的任務(wù)。

之前的人工智能比較擅長基于固定規(guī)則下的任務(wù),比如下圍棋AlphaGo做的很好,但如果把棋盤大小改變了,可能就要重新訓(xùn)練。今天有了通用人工智能,即便沒有這些規(guī)則,也能完成很多開放式任務(wù)。

像自動駕駛進入復(fù)雜城區(qū)場景,很多依靠規(guī)則其實沒法覆蓋,這些開放式任務(wù)正是通用人工智能所擅長的,包括智能座艙里各種人機交互,也在不斷提出新的需求,這些都可以通過通用人工智能去應(yīng)對。

另外,以前做人工智能,比較多的是識別,包括物體識別、人臉識別等,今天的通用人工智能可以是生成式AI,能自主生成大量內(nèi)容,包括文字、圖像和視頻,極大改變我們的文化、社會和生活。

具體到汽車行業(yè),我覺得AGI的影響主要有兩個方面:第一,會大幅提升生產(chǎn)效率。比如大家已經(jīng)能夠看到用Copilot做編程助手,汽車行業(yè)有大量軟件開發(fā),需要投入非常多的人力。未來在大模型駕駛領(lǐng)域,通過機器可以節(jié)省80%的工作量。

目前自動駕駛比較明顯的發(fā)展趨勢是基于大模型的端到端自動駕駛,以前基于規(guī)則的模式,進入復(fù)雜城區(qū)場景后,需要的代碼量可能是原來高速場景的幾十倍,因為每天要處理各種不同的Corner Case,需要很多工程師不斷解決各種新問題。但是大模型出現(xiàn)以后,通過數(shù)據(jù)驅(qū)動自動駕駛發(fā)展成為可能,從感知、規(guī)控到?jīng)Q策,可以通過一個網(wǎng)絡(luò)模型來實現(xiàn),靠數(shù)據(jù)覆蓋各種Corner Case,會在無形中大幅提升開發(fā)效率。

還有座艙里的DMS、OMS,過去根據(jù)疲勞監(jiān)測、分心監(jiān)測、打電話監(jiān)測等功能,每個特定任務(wù)都要投入專人開展數(shù)月研發(fā),現(xiàn)在有了多模態(tài)大模型,可以不斷增加新任務(wù),而模型本身無需改變,就能即時響應(yīng),效率提升十分明顯。

第二,AGI會改變?nèi)藱C交互方式。以前座艙里只能通過簡短固定語音指令完成特定任務(wù),今天有了大模型加持,可以進行各種開放式多輪對話,就像跟機器人對話一樣。包括現(xiàn)在座艙里面有很多APP,有時候要使用一個APP可能要找好久,現(xiàn)在AI智能體能自動完成這些事情。而且通過座艙里各種傳感器,系統(tǒng)還可以觀察駕乘人員的狀態(tài),并主動發(fā)起對話,變成一個超級智能體。所以說,汽車是實現(xiàn)大模型人機交互閉環(huán)一個非常好的場景。

對于智能終端,從最早AI 1.0時代的手機,到今天的汽車,再到將來的機器人,AI大模型給智能汽車帶來了非常大的想象空間。我們正從智能汽車1.0時代,走向一個真正的超級AI智能體。

Q:周曉鶯:感覺這個演變讓人非常興奮,會打開一個新天地,咱們預(yù)測過這個時間表嗎,或者一些關(guān)鍵的時間節(jié)點?

王曉剛:我覺得今明兩年是非常關(guān)鍵的時間窗口。一方面,自2022年底ChatGPT出圈,過去兩年通用人工智能發(fā)展十分迅猛,出現(xiàn)了很多新模型和應(yīng)用,給智能汽車帶來了非常多的機會。

另一方面,從智能汽車發(fā)展來看,比如智能駕駛前幾年還存在路線爭議,現(xiàn)在已經(jīng)收斂很多,行業(yè)對于未來的發(fā)展方向也比較明確。智能座艙有了大模型加持,意味著艙內(nèi)一系列軟硬件架構(gòu)都會發(fā)生變化,今天比較多還是調(diào)用云端大模型,將來一定是端云結(jié)合。這里面誰能抓住先機,改變用戶體驗,給客戶交付更有價值的產(chǎn)品,這一兩年將是重要的窗口期。

周曉鶯:所以這兩年大家要加速往前沖。

王曉剛:有人說現(xiàn)在既是短跑又是長跑,因為我們處在市場和技術(shù)都高速發(fā)展的階段,要能夠抓住它。但另一方面,通用人工智能的上限和天花板很高,現(xiàn)在遠沒達到上限,未來還有非常大的發(fā)展空間。

Q:周曉鶯:對于人工智能技術(shù)在各行各業(yè)的落地,商湯做了很多探索,這其中商湯絕影主要專注于智能汽車應(yīng)用,您能否分享下商湯絕影具體的戰(zhàn)略規(guī)劃?

王曉剛:商湯是一個人工智能平臺公司,無論發(fā)展還是創(chuàng)新,都需要由行業(yè)來牽引。早期互聯(lián)網(wǎng)、手機和智慧城市,是牽引公司發(fā)展的主要動力,但今天智能汽車成了牽引人工智能發(fā)展創(chuàng)新最重要的動力,因為汽車行業(yè)規(guī)模非常大。

另外,智能汽車是一個非常好的人機交互場景,而通用人工智能大模型又可以改變未來人機交互。所以絕影的發(fā)展戰(zhàn)略,是依托商湯的特長積累和戰(zhàn)略,抓住通用人工智能和大模型給智能汽車帶來的機遇。

這里面需要什么呢?第一,非常強的軟硬件基礎(chǔ)設(shè)施。我們從2018年開始研究大模型,那時還沒有能支撐大模型研究的基礎(chǔ)設(shè)施,所以我們建立了商湯大裝置,到今天一共有45000塊GPU,總算力突破了12000P,到今年年底將進一步達到16000P。作為對比,特斯拉目前有10萬塊GPU,而反觀國內(nèi)其他車企,在算力儲備方面和特斯拉還有很大的差距。因此在這方面,商湯絕影可以給行業(yè)提供比較好的基礎(chǔ)設(shè)施。

在此基礎(chǔ)上,我們還有一系列原生態(tài)大模型,包括自然語言模型、多模態(tài)模型、文生圖模型、文生視頻模型以及3D大模型,積累了大量Know-How。我們并不是一味追隨Open AI,而是有自己的創(chuàng)新點,比如我們2022年底發(fā)布了UniAD,這是業(yè)內(nèi)第一個端到端自動駕駛大模型,到現(xiàn)在可以看到端到端大模型用于自動駕駛已經(jīng)成為行業(yè)共識,我們的UniAD也有面向量產(chǎn)的方案,這體現(xiàn)了我們的原創(chuàng)性。

另外,去年5月我們還推出了用于機器人的具身智能模型。原來機器人比如AlphaGo所用的模型,只能解決已經(jīng)定義好比較規(guī)則的特定任務(wù),但具身智能模型可以解決很多開放式任務(wù),比如《我的世界》(Minecraft)里面的200多個任務(wù),都能去解鎖。而OpenAI和DeepMind用傳統(tǒng)的強化學(xué)習去做,只解鎖了其中的78個。所以從智能汽車到機器人,大模型可以帶來非常多的想象空間。

今年,大家對多模態(tài)模型落地有非常高的期待,但其實我們在2023年3月就開源了多模態(tài)模型,擁有30億參數(shù),是當時業(yè)內(nèi)最強的多模態(tài)模型。可以看到,這些模型布局我們都走在行業(yè)前面。

針對汽車行業(yè),我們對一系列大模型專門進行了優(yōu)化,通過與大量智艙、駕駛數(shù)據(jù)相結(jié)合,構(gòu)建專屬于汽車行業(yè)的原生態(tài)大模型,因為這里面很多任務(wù)不是通用模型能解決的,由此衍生出了一系列面向自動駕駛和智能座艙的方案。比如端到端自動駕駛大模型正在推進當中,智能座艙領(lǐng)域,我們?nèi)ツ暌舶l(fā)布了一系列基于大模型的產(chǎn)品,今年將進一步推出基于多模態(tài)大模型的AI智能體,更好助力智能座艙的體驗升維。比如前段時間上市的小米SU7,就應(yīng)用了我們的語言模型和多模態(tài)模型。另外從手機到其他各種智能終端,我們跟小愛同學(xué)都有比較好的合作。

所以商湯絕影整體的發(fā)展戰(zhàn)略叫“駕-艙-云”三位一體,所謂“云”就是各種基礎(chǔ)設(shè)施,可以助力整車廠和其他一些合作伙伴,進行智能駕駛和智能座艙相關(guān)開發(fā)。

“未來汽車將有很多智能體,各自擅長不同的能力”

Q:周曉鶯:從財報數(shù)據(jù)來看,去年商湯絕影智能汽車業(yè)務(wù)整體營收增幅超過了30%,相對于整個行業(yè)來說是一個非常好的成績,其中主要增長點來自哪些業(yè)務(wù)?

王曉剛:在智能駕駛方面,我們已經(jīng)交付了廣汽、合眾、一汽等車企,但真正要帶來收入增長,可能還需要一段時間。比較而言,智能座艙業(yè)務(wù)走的相對快一些,去年我們累計交付了40多個車型,量產(chǎn)規(guī)模大概有120多萬輛。今年,無論交付車型款數(shù)還是量產(chǎn)車數(shù)量,都會翻一倍。這里面我覺得兩個核心點在于,一個是智能汽車的滲透率在快速提升,另一個是汽車對新技術(shù)、新產(chǎn)品的追求給我們帶來了比較好的機會。

周曉鶯:恰恰是您講的這兩點,汽車智能化發(fā)展和對新技術(shù)的追求,現(xiàn)在都在快速上量。

王曉剛:所以我們也需要不斷加大投入,提升效率。商湯在人工智能領(lǐng)域有比較好的儲備和積累,同時我們也在不斷強化工程體系、交付能力以及與車企的合作能力,更好地服務(wù)這個行業(yè)。

Q:周曉鶯:您前面提到一系列大模型,包括在汽車領(lǐng)域的兩條發(fā)展路徑,能不能展開講一下大模型上車與這些產(chǎn)品及應(yīng)用之間的邏輯關(guān)系?商湯絕影大模型有哪些獨特亮點?

王曉剛:有比較多的相關(guān)性,比如多模態(tài)大模型的基礎(chǔ)是,首先你要有強大的語言模型、視覺模型,才能在這個基礎(chǔ)上去形成更加強大的多模態(tài)模型。另外我們還有文生視頻模型、文生圖模型,積累了大量的Know-How。

具體到產(chǎn)品方面,我們已經(jīng)有UniAD自動駕駛端到端大模型,在此基礎(chǔ)上,依托多模態(tài)大模型,進一步拓展研發(fā)了新一代自動駕駛大模型 DriveAGI,其中的數(shù)據(jù)輸入除了各種傳感器,還有駕駛員的指令。因為現(xiàn)在的自動駕駛,基本上都是確定好目的地后車輛自主駕駛,在這個過程當中,其實有很多人機交互應(yīng)用。比如每個人駕駛習慣不一樣,或者在不同情況下對車輛駕駛行為需求不一樣,比如有些人趕時間可能會頻繁地換道超車,有些人希望能在車上安靜地看書,這時可以跟系統(tǒng)做一些互動。

從輸出角度,以前車輛就是一個“黑盒子”,但現(xiàn)在有了大模型以后,當車輛做出各種決策時,其實可以通過自然語言解釋一下為什么要這么開,這是我們覺得多模態(tài)大模型能夠給自動駕駛帶來的一個延伸。

另外從產(chǎn)品角度,我們知道訓(xùn)練自動駕駛算法需要大量端到端數(shù)據(jù),這些數(shù)據(jù)除了實際采集,還要大量的仿真數(shù)據(jù),因為有些時候想得到特定場景的訓(xùn)練數(shù)據(jù)比較難,并且越到后面數(shù)據(jù)采集效率越低。在這種情況下,我們的文生視頻模型就可以用來生成各種攝像頭角度、各種車況或者交通場景下的視頻,進行自動駕駛測試和算法訓(xùn)練。

除了自動駕駛,我們也在探索怎么跟座艙里的大模型結(jié)合,因為未來趨勢是艙駕融合,在一顆芯片上同時部署智駕大模型和座艙大模型,實現(xiàn)各種傳感器、車內(nèi)車外數(shù)據(jù)的聯(lián)通。

比如在駕駛過程中,我們看到車外的建筑物,或者靠近某個景點、交通路口時,會問各種問題,模型能給出智能化的回答,這要求延時非常低。但是現(xiàn)在我們艙內(nèi)的一些模型還放在云端,有延遲,存在一些數(shù)據(jù)方面的問題。

將來通過端云結(jié)合,我們希望80%的這種問題能夠通過端上的芯片完成,及時響應(yīng),同時成本比較低,從而實現(xiàn)比較好的用戶體驗。未來,我們判斷越來越多的公司會使用MoE(Mixture of Experts)架構(gòu),也就是混合專家模型,就是很多模型在各種不同情況下,針對不同任務(wù)調(diào)用不同模型,這樣會極大地降低算力。

Q周曉鶯:感覺以后開車,在體驗上會越來越絲滑,但實際上后面的系統(tǒng)也會越來越復(fù)雜。

王曉剛:對,有很多智能體,這些智能體有各自擅長的不同能力,甚至包括自動駕駛也不一定是一個模型,比如在高速場景和復(fù)雜路口,或者擁擠的路段、鄉(xiāng)間小路,每個模型擅長的事情都不一樣。

Q周曉鶯:最好大模型供應(yīng)商是一家企業(yè),否則會不會打架?

王曉剛:所以將來研發(fā)模式也會發(fā)生變化,之前一個系統(tǒng)被切成很多模塊,由不同供應(yīng)商提供各個模塊,現(xiàn)在因為有一個大模型整體協(xié)調(diào),技術(shù)耦合度會更高。但另一方面,這又要求跟整車廠之間的合作更深入,因為會涉及軟硬件架構(gòu)的改變,而且每家車企還有自己定制化的內(nèi)容、獨特賣點和特征,這需要更加深度的耦合。

Q周曉鶯:關(guān)于大模型到底怎么上車這件事情,是否方便分享一些跟車企合作的案例?因為這還是一個蠻新的領(lǐng)域,雖然大家談了很多。

王曉剛:去年大模型剛剛開始應(yīng)用時,跟車企的合作相對簡單一些,就是提供模型給車企測一測,或者把幾個模型比較一下,誰的能力強選誰。但后來慢慢發(fā)現(xiàn),通用模型其實解決不了實際問題,很多執(zhí)行指令以及可靠性滿足不了車企需求,需要定制化開發(fā)。

另外原來的云端模型存在固有缺陷,光有一個云端模型還不行,而是需要若干個模型結(jié)合起來,這又會涉及到車內(nèi)軟件架構(gòu)的改變,包括這些模型還需要跟整車生態(tài)聯(lián)合,因為車內(nèi)有很多APP,智能體要調(diào)用這些APP。在這個過程當中,我們和車企逐漸變成了深度耦合、密切合作的關(guān)系。我覺得這可能也是未來的一個趨勢。因為在技術(shù)發(fā)生變革的時候,大家都希望能夠參與其中,共同設(shè)計這些架構(gòu)。

Q周曉鶯:這不像傳統(tǒng)汽車時代,只是簡單地增加一個部件或者一個功能,而更像是兩個大的生態(tài)在相互融合。

王曉剛:比如原來車企內(nèi)部,會根據(jù)電子電氣架構(gòu)設(shè)置各個部門,但大模型出現(xiàn)后,會對過去的很多功能和模塊進行重構(gòu),這將帶來組織架構(gòu)變化,也即是生產(chǎn)力變化帶來生產(chǎn)關(guān)系變化,這也是為什么我覺得接下來像絕影這樣的新供應(yīng)商會有機會。所以在帶來新技術(shù)的同時,我們還要對自身組織結(jié)構(gòu)進行重整,以適應(yīng)技術(shù)的發(fā)展變化,包括跟整車廠合作模式的變化,誰先把這些事情理順,誰就能走得更快。

Q周曉鶯:所以絕影的優(yōu)勢,我覺得像您講的不管是對人工智能的理解和應(yīng)用,還是組織架構(gòu)、人才儲備,其實都有比較長和比較深的積累。

王曉剛:我們在技術(shù)上有一定的積累,同時也認識到了技術(shù)對我們組織架構(gòu)帶來的新變化。所以我們現(xiàn)在是以一種開放的心態(tài)重新創(chuàng)業(yè),打破原來的組織分工形態(tài),我們跟車廠也保持非常開放的態(tài)度,共同探索新的模式。

“智能駕駛往后發(fā)展,降本將是重要趨勢”

Q周曉鶯:在智駕領(lǐng)域,絕影量產(chǎn)智駕方案已經(jīng)上車哪吒S、廣汽昊鉑等車型,后續(xù)還有何新的量產(chǎn)落地規(guī)劃?

王曉剛:接下來,我們還會持續(xù)更新系統(tǒng)功能,不斷提升用戶體驗。在哪吒S上,我們已經(jīng)率先在16 TOPS算力條件下實現(xiàn)了高速領(lǐng)航功能,接下來通過OTA升級,我們還會持續(xù)優(yōu)化用戶體驗,同時也希望不斷拓展新的車型、新的功能。

Q周曉鶯:對于城市智駕,我們看過去兩年“大算力芯片+激光雷達”幾乎成為標配,您對此怎么看?

王曉剛:我覺得智能駕駛再往后發(fā)展,降本將是一個重要趨勢,所以擺脫對激光雷達的依賴,主要依靠視覺的方案,也會是未來的一個發(fā)展趨勢。當然到了L3,需要冗余備份的時候,還是需要激光雷達。但是對于L2.9的城區(qū)領(lǐng)航,我們其實也在做純視覺方案,包括端到端的UniAD,就是基于視覺方案在做。

談到算力,首先還是在不斷地增長,但同時也在追求性價比,并希望在體驗上有一些突破,因為畢竟有大模型加持,這方面我覺得還有探索空間。比如未來的艙駕融合,在一顆芯片上同時部署智駕和智艙,能夠降低成本。另外我們也看到,芯片廠商仍在不斷提升算力,這給大模型在端上落地提供了更大空間。

所以我覺得未來智駕大算力演進和降本會交替進行,并在體驗上不斷上探天花板。同時對一些比較成熟的功能,會通過降本提升性價比,實現(xiàn)更大量產(chǎn)規(guī)模。

Q周曉鶯:所以絕影非常堅定地看好純視覺路線,是因為剛才講的成本?

王曉剛:也是本身的基因所在,視覺是商湯的專長,早在2016年本田來中國尋找合作伙伴的時候,就給我們出題用兩顆攝像頭怎么完成自動駕駛,隨后2017年我們基于兩顆攝像頭完成了要求。

而除了成本優(yōu)勢,比較之下視覺方案提供的信息也更加豐富,天花板更高。尤其在復(fù)雜場景中,端到端方案通過視覺感知能提取更豐富的信息,獲取有價值信息的能力會變得更強,這也是我們看好視覺的一個重要原因。

Q周曉鶯:您覺得端到端方案是城市智駕的最優(yōu)解嗎?

王曉剛:我覺得是這樣的,因為城市智駕覆蓋的復(fù)雜場景非常多,包括各種Corner Case,并且大家對體驗的要求也在不斷提升。不過今天雖然都在談端到端,實現(xiàn)的方式還不太一樣,有些其實是兩段式的,即感知和規(guī)控分兩部分。

因為此前只有感知部分使用的是AI神經(jīng)網(wǎng)絡(luò),規(guī)控部分使用的是規(guī)則。目前很多方案還是兩段式的,只不過把其中的規(guī)控改為了用神經(jīng)網(wǎng)絡(luò)來實現(xiàn),整體難度相對低一些。但也會帶來一些新的問題,因為經(jīng)過感知過濾以后,有些信息會丟失,如此一來規(guī)控提取的信息會相對有限。

而真正的端到端,像特斯拉做的,輸入的是視頻、圖像,輸出的是規(guī)控軌跡,這個難度高很多,因為前面的信息源非常復(fù)雜,但要輸出的是非常精準的控制信息,這其中對技術(shù)和網(wǎng)絡(luò)的要求都非常高,天花板也更高,因為中間沒有人為分拆,不會損失信息。

Q周曉鶯:就是雖然都叫端到端,中間還是有非常多的差異,回到大模型也一樣,這兩年特別火,包括汽車行業(yè)整車廠和技術(shù)公司也都在推自己的大模型,您怎么看待這個現(xiàn)象?

王曉剛:我覺得這是一個必然過程,大模型出現(xiàn)以后,大家都想去嘗試。但未來一定會收斂,因為這對資源的投入要求非常高,并且需要不斷追蹤技術(shù)的發(fā)展。今天大模型的發(fā)展不是已經(jīng)到了天花板,而是還處在一個快速發(fā)展的階段,對投入要求非常高。

剛才提到算力,我們?nèi)ツ暌呀?jīng)實現(xiàn)了1000P算力,等效于把3000塊A100芯片連在一起進行大模型網(wǎng)絡(luò)訓(xùn)練。今年我們的目標是實現(xiàn)3000P算力,等效于1萬塊A100連成一個集群用來訓(xùn)練網(wǎng)絡(luò),明年進一步達到10000P算力,整個基礎(chǔ)設(shè)施是不斷演進的。

但我們看今天很多做大模型的企業(yè),可能只有100P或者幾百P的算力,其實不具備這種原生態(tài)大模型能力,而是拿一些開源模型在上面做修改。這樣一來,如果想做一些根本性的創(chuàng)新很難,而且這是一個持續(xù)投入的過程。

我們看過去十年人工智能的發(fā)展,2012年神經(jīng)網(wǎng)絡(luò)第一次在視覺里面取得比較大的突破,之后從AlexNet到AlphaGO,再到今天的GPT-4,算力需求已經(jīng)增長了1000萬倍,目前還在不斷增長。在這種情況下,前面說既是短跑又是長跑,如果從長跑角度來看,不太可能每家車廠都構(gòu)建自己的大模型,更多可能是找到這方面的合作伙伴,而且這個合作伙伴也需要在這條路上持續(xù)投入,持續(xù)創(chuàng)新,我覺得這恰恰是商湯絕影的機會。

在AGI領(lǐng)域,商湯本身就有很深的積累,同時我們也是非常堅定地持續(xù)往前走。未來,我相信整車廠能夠意識到基礎(chǔ)設(shè)施所帶來的價值,到時候我們怎么能夠更好地深入合作,什么是他們要做的,什么由我們來做,會慢慢清晰。

周曉鶯:大家需要一個時間學(xué)習新東西,并且在定位上慢慢把邊界區(qū)隔開,而不是什么都自己做。

王曉剛:尤其大模型發(fā)展很快,可能你上一代還沒有100%達到別人的水平,別人下一個版本又出來了。

“整車廠邁向通用人工智能,商湯絕影希望成為核心供應(yīng)商”

Q周曉鶯:剛剛提到算力,原來燃油車時代是靠馬力驅(qū)動,現(xiàn)在智能車時代靠算力驅(qū)動,咱們有預(yù)測過智能汽車變革對算力的需求上限嗎?

王曉剛:今天還沒有看到上限,我們知道人腦的神經(jīng)元數(shù)量約為860億個,如果把每個神經(jīng)元的突觸算上,相當于百萬億規(guī)模,今天還遠遠沒有達到上限。所以可以看到,目前對算力的需求還在持續(xù)增加。

不過我覺得未來可能是“云端模型+離線模型+終端模型”的融合狀態(tài),汽車領(lǐng)域有望出現(xiàn)一個超級強的大模型,類似于今天的GPT-4,然后派生出若干個能部署在終端的小模型。在此過程中,隨著算力提升,終端小模型的能力將逐漸增強。

Q周曉鶯:商湯大裝置現(xiàn)在算力是12000P,后面的算力規(guī)劃能不能給我們講講?

王曉剛:今年底計劃達到16000P,但這里面的規(guī)劃其實滯后于需求。我們最早規(guī)劃大裝置的時候,算力是5000P,但實際需求很快就超過了當時的計劃。所以說這個領(lǐng)域還是一個高速發(fā)展的狀態(tài),但有一點比較肯定,就是商湯作為人工智能平臺性企業(yè),在這些方面一定要抓住制高點。

Q周曉鶯:過去兩年我們也看到很多車企在組建智算中心,您覺得這個現(xiàn)象會持續(xù)嗎?

王曉剛:組建智算中心投入非常大,還可能出現(xiàn)的一種情況是,智算中心剛建好發(fā)現(xiàn)規(guī)模不夠用了。所以對算力的規(guī)劃一定要留有冗余,用于彈性調(diào)度,這樣的規(guī)模化才是最經(jīng)濟的。如果說每家公司都具備100P或者200P的算力,將來可能不僅不能解決自身問題,還會產(chǎn)生比較高的維護成本,從這個角度并不是一個經(jīng)濟的選擇,可能選擇合作更合適。

其實商湯原本也在各地組建了比較多小的算力中心,后來才統(tǒng)一匯聚到臨港,實現(xiàn)像剛才說的萬卡集群大算力,大家的任務(wù)可以充分調(diào)配我們的算力,達到一個最優(yōu)使用情況。不然的話,想擴充算力規(guī)模的時候擴不出去,另外使用效率也不是很高。

周曉鶯:它更像是一種新基建。

王曉剛:而且技術(shù)難度很高,當我們把10000塊GPU連在一起的時候,中間只要一塊GPU出現(xiàn)問題,或者硬件之間的連接出問題,都會對整個系統(tǒng)帶來影響?,F(xiàn)在商湯可以進行萬卡互聯(lián)的超大集群訓(xùn)練,且能夠長時間穩(wěn)定運行,一旦出現(xiàn)問題,異常檢測速度已達到分鐘級,能實現(xiàn)快速診斷并及時修復(fù)。這些都是我們這么多年訓(xùn)練AI大模型計算過程中積累的經(jīng)驗,如果每家公司自己去做的話,是不劃算的。

Q周曉鶯:人工智能某種程度屬于科技非常頂端的技術(shù),不僅研發(fā)投入大,回報周期也很長。而現(xiàn)在汽車行業(yè)競爭十分激烈,企業(yè)會面臨很多選擇,比如究竟要市場份額還是利潤,對于商湯絕影來說,怎么看待在汽車產(chǎn)業(yè)商業(yè)閉環(huán)走的更久,能夠更好盈利這件事情?

王曉剛:我們也還在探索當中,在汽車行業(yè)絕影非常年輕,還有很多東西需要學(xué)習。我們也從汽車行業(yè)引進了大量相關(guān)人才,一方面推進產(chǎn)品落地,加深跟客戶的合作關(guān)系,另一方面對下一代技術(shù)提前布局。因為技術(shù)迭代非??欤赡苓@一代技術(shù)或產(chǎn)品搶到了市場份額,但又失去了下一代技術(shù)更新迭代的機會。所以我們看絕影的商業(yè)價值,也是放在商湯大背景下面,希望通過比較好的技術(shù)持續(xù)引領(lǐng)市場,而不是停留在某一個階段。

Q周曉鶯:從您的視野來看,現(xiàn)在中國智能汽車的發(fā)展和應(yīng)用,包括大模型上車,您覺得在全球市場大概處于什么樣的生態(tài)位?

王曉剛:發(fā)展肯定是非??斓?,當然如果說美國的話,特斯拉肯定是行業(yè)標桿。除此之外我覺得國內(nèi)過去幾年的積累包括迭代速度,都體現(xiàn)出了比較強的競爭力。所以將來把我們這些智能化技術(shù)推向全球,也是很重要的一個點。

Q周曉鶯:如果往后看三年,您對商湯絕影的發(fā)展有何期待?

王曉剛:從自身定位來說,面向未來AGI發(fā)展目標,我們希望能夠助力整車廠和合作伙伴,去實現(xiàn)我們新的定位和價值。

本身絕影就是一匹千里馬,需要能夠跑的比較遠,我覺得這是時代給了我們非常遠大的目標,和充滿想象力的空間。同時我們還要跟整車廠緊密合作,扎扎實實做好產(chǎn)品落地。今天市場競爭仍然非常激烈,我們希望能夠做好產(chǎn)品交付,同時在行業(yè)里面持續(xù)引領(lǐng)創(chuàng)新。

希望三年以后絕影能夠成為AGI時代整車廠走向通用人工智能非常重要的核心技術(shù)伙伴,非常核心的供應(yīng)商。如果能夠?qū)崿F(xiàn)這點的話,我會非常高興,我想商湯也非常高興實現(xiàn)我們的目標。

周曉鶯:我們也非常期待商湯絕影在接下來的發(fā)展中,像千里馬一樣跑得越來越快。

彩蛋

Q周曉鶯:您小時候就是學(xué)霸,中科大的少年班,后來從學(xué)術(shù)到產(chǎn)業(yè)會有不適應(yīng)嗎?

王曉剛:各種調(diào)整吧,我剛來公司的時候,湯老師說你只要管好技術(shù)就行,不需要負責管理。但后來其實發(fā)現(xiàn),如果不懂技術(shù)也管不了人,而不懂管理,也形成不了落地的結(jié)果,因為還是結(jié)果為導(dǎo)向。

我剛到商湯的時候并不管業(yè)務(wù),后來需要負責一些具體業(yè)務(wù),商務(wù)收入指標,各方面要求還比較高。但我覺得這也是商湯的選擇,公司發(fā)展需要你變成一個什么樣的人,能夠隨著發(fā)展快速做出調(diào)整。

另一方面,這個轉(zhuǎn)變對我來說還是非常感恩,我非常珍惜這個轉(zhuǎn)變。因為人工智能發(fā)展非???,待在學(xué)校里很多事情做不了,要資源實現(xiàn)AI落地。十幾年前我們做AI研究都是停留論文上,2004年我們發(fā)表了五篇CVPR,那時候中國很少有人能做到。但今天不一樣,論文很多,甚至都用ChatGPT來寫論文。

周曉鶯:生產(chǎn)工具不一樣。

王曉剛:但要形成影響力的話,在產(chǎn)業(yè)里面把AI落地是非常重要的點。從培養(yǎng)人才來說,以前我就帶十幾個博士生,每年有幾個人畢業(yè)。但到了商湯,我們這幾年培養(yǎng)了幾千人。

對人才的培養(yǎng),底層其實還是要實現(xiàn)技術(shù)突破,讓技術(shù)產(chǎn)生社會價值,同時也能培養(yǎng)人,底層邏輯是一樣的。但這里面實現(xiàn)的方式不一樣,從原來的學(xué)術(shù)背景到今天的產(chǎn)業(yè)界,風格各方面都不一樣。

但這里面我也能體會到自己的優(yōu)勢,比如說管理,他們之前給我上了很多管理課,最終我發(fā)現(xiàn)精髓就兩個字:信任。這個和我以前做老師,背后的核心邏輯是相通的,可能表面看著有很多不一樣,但做事、管理不可避免會帶著原來的背景,也會做出不一樣的事情。

其實不光是我,湯老師以前做這些事情,能夠?qū)崿F(xiàn)超出行業(yè)引領(lǐng)性的東西,因為他原來也不是一個企業(yè)家。有時候思考維度、追求的東西不一樣,反而能夠做出一些引領(lǐng)性的東西出來。

Q周曉鶯:您覺得在自己的發(fā)展經(jīng)歷當中,什么對您影響特別大?

王曉剛:那肯定是湯老師對我影響最大,我2001年本科畢業(yè),那時連CVPR是什么都不知道,國外那些高水平研究、論文都沒見過。到后面他創(chuàng)立商湯,要做公司,我說我們做研究挺好的,為什么要做公司,他一步一步把我們的人生軌跡改變了。

周曉鶯:遇到一個好的老師,人生的引路人很重要。

王曉剛:2001年的時候,相當于中國AI研究從中國走向世界,原來就是自己搞,都不知道高水平研究是什么。2014年就是AI落地了,從寫論文到產(chǎn)業(yè)落地,也是一個劃時代變化。再到2021年湯老師做國家實驗室,AI變成了國家的一個戰(zhàn)略選擇,一個責任。所以說每一步都有深刻意義,也是在那個時代背景下發(fā)生的事。

Q周曉鶯:您對現(xiàn)在年輕人有什么好的建議嗎?

王曉剛:最早湯老師給我們的要求就是要堅持原創(chuàng)、堅持創(chuàng)新,做別人沒有做過、不敢想的事情,這在今天可能特別缺少。為什么會出現(xiàn)“百模大戰(zhàn)”?ChatGPT出現(xiàn)之前沒有“百模大戰(zhàn)”,因為之前大家不知道能不能做出來,所以就不投入。一旦做出來了,大家覺得是確定的東西,都開始做同樣的事情,重復(fù)消耗了很多資源。所以能夠跳出這些思維,勇于擔當去做一些新東西,并且能夠堅持。

推薦器件

更多器件
器件型號 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊 ECAD模型 風險等級 參考價格 更多信息
A4970SLBTR-T 1 Allegro MicroSystems LLC Brushless DC Motor Controller, 1A, PDSO24, LEAD FREE, MS-013AD, SOIC-24

ECAD模型

下載ECAD模型
$4.16 查看
L6235PD 1 STMicroelectronics DMOS driver for 3-phase brushless DC motor

ECAD模型

下載ECAD模型
$10.71 查看
TS5A23159DGSR 1 Texas Instruments 1-Ω on-state resistance, 5-V, 2:1 (SPDT), 2-channel analog switch with powered-off protection 10-VSSOP -40 to 85

ECAD模型

下載ECAD模型
$0.91 查看
商湯科技

商湯科技

商湯科技以“堅持原創(chuàng),讓 AI 引領(lǐng)人類進步”為使命,目前業(yè)務(wù)涵蓋智慧商業(yè)、智慧城市、智慧生活、智能汽車四大板塊。

商湯科技以“堅持原創(chuàng),讓 AI 引領(lǐng)人類進步”為使命,目前業(yè)務(wù)涵蓋智慧商業(yè)、智慧城市、智慧生活、智能汽車四大板塊。收起

查看更多

相關(guān)推薦

電子產(chǎn)業(yè)圖譜