加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長(zhǎng)期合作伙伴
立即加入
  • 正文
  • 推薦器件
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

沈向陽(yáng)院士:AI Agent時(shí)代,大模型產(chǎn)業(yè)落地的八個(gè)思考

09/06 09:30
911
閱讀需 9 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

9月5日,香港科技大學(xué)校董會(huì)主席、美國(guó)國(guó)家工程院外籍院士沈向洋在2024 Inclusion·外灘大會(huì)上分享了他對(duì)大模型產(chǎn)業(yè)落地的八個(gè)思考。他認(rèn)為,AI Agent時(shí)代的到來(lái),不會(huì)是一個(gè)神奇而強(qiáng)大的模型突然代替了所有工作流,它涉及技術(shù)、工程與市場(chǎng)的不斷磨合,最終以超預(yù)期的服務(wù)呈現(xiàn)給人類。

思考一:算力是門(mén)檻

“今天做大模型,做深度學(xué)習(xí),首先最重要的事情是要有算力。”沈向洋表示。他指出,從2010年開(kāi)始,大模型需要的算力以6、7倍的速度增長(zhǎng)。這幾年穩(wěn)定下來(lái),大概每年有4倍的增長(zhǎng)。模型越來(lái)越大,參數(shù)量越來(lái)越大,算力的需求也隨著參數(shù)的增長(zhǎng),呈現(xiàn)出平方向的增長(zhǎng)。在他看來(lái),整個(gè)計(jì)算機(jī)芯片行業(yè)的發(fā)展已經(jīng)從原來(lái)的“摩爾定律”變成了“黃氏定律”。以前摩爾定律認(rèn)為,算力每隔18個(gè)月增長(zhǎng)一倍。如今預(yù)測(cè),GPU將推動(dòng)AI算力實(shí)現(xiàn)逐年翻倍。“講卡傷感情,沒(méi)卡沒(méi)感情。以前有一句話叫貧窮限制想象力,現(xiàn)在貧窮可能扭曲想象力,因?yàn)槿绻麤](méi)有卡,能想象要做的項(xiàng)目可能就不太一樣了。”沈向洋感慨道.

思考二:關(guān)于數(shù)據(jù)的數(shù)據(jù)

公開(kāi)資料顯示,GPT3的訓(xùn)練數(shù)據(jù)達(dá)到了2個(gè)T的token(吞吐量),GPT4則達(dá)到了12個(gè)T左右。據(jù)沈向洋預(yù)判,GPT5的訓(xùn)練數(shù)據(jù)可能會(huì)達(dá)到200個(gè)T。目前互聯(lián)網(wǎng)上的數(shù)據(jù)遠(yuǎn)遠(yuǎn)不能滿足未來(lái)模型訓(xùn)練的需求,還需要思考用什么辦法去挖掘更多的數(shù)據(jù)。在人工智能領(lǐng)域,數(shù)據(jù)被視為模型的“燃料”,模型需要從這些數(shù)據(jù)中學(xué)習(xí)和提取有用信息。因此,數(shù)據(jù)的數(shù)量、質(zhì)量和多樣性都會(huì)直接影響到模型的準(zhǔn)確性和性能。沈向洋表示,之前作為互聯(lián)網(wǎng)最核心的積累,數(shù)據(jù)大多被谷歌用來(lái)做搜索引擎,以后這些數(shù)據(jù)都會(huì)被拿來(lái)訓(xùn)練大模型?!盎ヂ?lián)網(wǎng)40年積累的數(shù)據(jù),好像就是為了這樣一個(gè)AI時(shí)刻”。

思考三:大模型的下一章

下一步到底要干什么?沈向洋認(rèn)為,大模型產(chǎn)業(yè)未來(lái)的發(fā)展路徑已經(jīng)非常明確,將會(huì)從之前的大語(yǔ)言模型,到多模態(tài)模型,未來(lái)邁向世界模型。從技術(shù)上講,肯定要走理解和生成統(tǒng)一起來(lái)的道路?!拔磥?lái)一定會(huì)往具身智能方向上走,往機(jī)器人上面走,其中一個(gè)特殊形態(tài)就是自動(dòng)駕駛?!鄙蛳蜓笳f(shuō)道。實(shí)際上,關(guān)于世界模型業(yè)內(nèi)并沒(méi)有形成一個(gè)標(biāo)準(zhǔn)的定義。OpenAI推出的Sora模型曾引發(fā)業(yè)內(nèi)對(duì)“世界模型”的探討。OpenAI將其視為能夠理解和模擬現(xiàn)實(shí)世界的模型的基礎(chǔ),相信其能力是實(shí)現(xiàn)AGI(通用人工智能)的重要里程碑。然而,沈向洋認(rèn)為,“Sora模型雖然做的非常好了,但還不是那么強(qiáng)大,里面的物理性質(zhì)是不能保證的,做不到一個(gè)世界模型?!?/p>

思考四:大模型橫掃千行百業(yè)

大模型可分為通用大模型、行業(yè)大模型、企業(yè)大模型和個(gè)人大模型。沈向洋指出,通用大模型是AI的基礎(chǔ),要訓(xùn)練一個(gè)通用大模型至少需要萬(wàn)卡;行業(yè)大模型是做領(lǐng)域應(yīng)用的底座,需要千卡級(jí)別的訓(xùn)練;企業(yè)大模型是企業(yè)數(shù)據(jù)價(jià)值的再發(fā)現(xiàn),需要百卡級(jí)別的訓(xùn)練。這些大模型都對(duì)算力的要求極高?!白罴?dòng)人心的是個(gè)人大模型,比如聯(lián)想、微軟在推AIPC和蘋(píng)果的Apple Intelligence等都是朝著個(gè)人智能這個(gè)方向發(fā)展的?!鄙蛳蜓笳f(shuō)道。截至今年7月底,中國(guó)已備案大模型達(dá)到了197個(gè),其中30%是通用大模型,70%是行業(yè)大模型。“可以看到,行業(yè)大模型占到絕大多數(shù),未來(lái)肯定還會(huì)越來(lái)越多?!鄙蛳蜓蟊硎尽?/p>

思考五:AI Agent——從愿景到落地

2024年5月,微軟公司創(chuàng)始人比爾·蓋茨公開(kāi)表示,AI Agent不僅會(huì)改變每個(gè)人與計(jì)算機(jī)交互的方式,還將顛覆軟件行業(yè),帶來(lái)從鍵入命令到點(diǎn)擊圖標(biāo)以來(lái),最大的計(jì)算革命。沈向洋對(duì)此觀點(diǎn)表示認(rèn)同。他認(rèn)為,人工智能時(shí)代,真正了不起的超級(jí)應(yīng)用就是AI Agent。AI Agent從愿景到落地的過(guò)程中,需要始終以需求為圓點(diǎn),深刻理解模型的能力,并構(gòu)建一個(gè)AI深度參與的工作流程?!敖裉煸谝患夜纠锕ぷ鞯脑?,整個(gè)工作流是非常復(fù)雜的,ChatGPT雖然很強(qiáng)大,但遠(yuǎn)遠(yuǎn)沒(méi)達(dá)到Agent的程度,它只實(shí)現(xiàn)了單點(diǎn)突破,真正要向前走還得融入整個(gè)工作流?!彼f(shuō)。

思考六:重視AI的治理

AI治理非常重要。今年世界人工智能大會(huì)(WAIC)的主題就是在講AI治理,各個(gè)國(guó)家對(duì)于這件事情的看法有很多不一樣。AI的發(fā)展,對(duì)民眾、公司、政府監(jiān)管、社會(huì)發(fā)展等各個(gè)方面都產(chǎn)生了強(qiáng)大的沖擊,引發(fā)了公眾對(duì)于其安全治理的擔(dān)憂?!拔矣X(jué)得接下來(lái)人工智能的發(fā)展很重要的一點(diǎn),從全球各個(gè)國(guó)家角度來(lái)講,是一定要做主權(quán)人工智能,而主權(quán)人工智能背后一定需要有一個(gè)主權(quán)云來(lái)支持主權(quán)人工智能的發(fā)展?!鄙蛳蜓蟊硎?。

思考七:重新思考人機(jī)關(guān)系

“GPT帶來(lái)的沖擊有多少是人機(jī)交互的震撼,又有多少是機(jī)器智能的發(fā)展?”沈向洋認(rèn)為應(yīng)該重新思考人機(jī)之間的關(guān)系。他指出,AI為人類提供了與技術(shù)共生的全新語(yǔ)境,人機(jī)交互的新方式指向“AI與IA”的融合共進(jìn)。IA(Intelligent Augmentation),即智能增強(qiáng),代表著一種以人為本的 AI 發(fā)展路徑。它聚焦于運(yùn)用技術(shù)提升人類的能力,而非取代人類,強(qiáng)調(diào)了人類與 AI 之間的協(xié)作關(guān)系?!凹~約時(shí)報(bào)專欄作者John Markoff 提到,計(jì)算機(jī)過(guò)去幾十年的發(fā)展路程里,真正的贏家是做人機(jī)交互的。不管是什么技術(shù),最后的目的都應(yīng)該是幫助人類更好地使用機(jī)器?!鄙蛳蜓蟊硎荆暗搅薃I時(shí)代,人機(jī)交互最本質(zhì)的是對(duì)話,就像ChatGPT這樣。ChatGPT加上微軟,會(huì)不會(huì)成為AI時(shí)代最偉大的公司?我想只有時(shí)間才能夠驗(yàn)證。”

思考八:智能的本質(zhì)

今天,GPT的發(fā)展如火如荼,但實(shí)際上,人們對(duì)智能的理解還是非常有限的。不同于物理學(xué),上到浩瀚的星空,下到微小的量子,都能有一個(gè)大一統(tǒng)的理論可以解釋;今天的深度學(xué)習(xí)很多東西都是不可解釋的,沒(méi)有魯棒性?!爸悄艿谋举|(zhì)是神經(jīng)網(wǎng)絡(luò)與符號(hào)系統(tǒng)的世紀(jì)之爭(zhēng)?!鄙蛳蜓笳f(shuō)道,“今天,雖然人工智能的發(fā)展還處在一個(gè)相對(duì)來(lái)講比較早期的階段,但是行業(yè)上已經(jīng)有很多的應(yīng)用,值得下定決心去做,我對(duì)未來(lái)的發(fā)展充滿信心?!?/p>

 

作者丨宋婧編輯丨趙晨美編丨馬利亞監(jiān)制丨連曉東

推薦器件

更多器件
器件型號(hào) 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊(cè) ECAD模型 風(fēng)險(xiǎn)等級(jí) 參考價(jià)格 更多信息
ATXMEGA128A3U-AUR 1 Microchip Technology Inc IC MCU 8BIT 128KB FLASH 64TQFP
$5.3 查看
DS3234S#T&R 1 Maxim Integrated Products Real Time Clock, 1 Timer(s), CMOS, PDSO20, 0.300 INCH, ROHS COMPLIANT, SOP-20
$7.73 查看
STM32F429VIT6 1 STMicroelectronics High-performance advanced line, Arm Cortex-M4 core with DSP and FPU, 2 Mbytes of Flash memory, 180 MHz CPU, ART Accelerator, Chrom-ART Accelerator, FSMC, TFT

ECAD模型

下載ECAD模型
$34.08 查看

相關(guān)推薦

電子產(chǎn)業(yè)圖譜