加入星計劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴散
  • 作品版權(quán)保護
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
    • 01.穩(wěn)住大模型霸主地位“草莓”能幫新旗艦?zāi)P蜏p少幻覺
    • 02.OpenAI收入告急?今年夏天已向政府官員展示
    • 03.結(jié)語:OpenAI尋求開辟更多收入機會
  • 推薦器件
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

曝OpenAI“草莓”今秋發(fā)布,前身為神秘Q*模型

08/29 10:10
1832
閱讀需 9 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

作者 |??程茜,編輯?|??心緣

“草莓”模型對OpenAI新旗艦?zāi)P图癎PT-4的改進都至關(guān)重要。

OpenAI的“草莓”要熟了?

智東西8月28日報道,今天,外媒The Information援引知情人士稱,OpenAI將在今年秋天推出代號為“草莓”(之前被稱為Q*)的新模型。

“草莓”項目就是盛傳已久的神秘Q*模型,據(jù)傳是此前戲劇化的OpenAI政變關(guān)鍵原因之一。它展現(xiàn)出了解答未見過的數(shù)學(xué)問題、復(fù)雜編程的更強大能力,當(dāng)時讓AI安全的研究人員都為之震驚。

這一項目當(dāng)下最重要的用處有兩個:一是改進ChatGPT等現(xiàn)有產(chǎn)品,二是幫助OpenAI開發(fā)下一代旗艦?zāi)P蚈rion。這些都指向了OpenAI想要保持自己在大模型領(lǐng)導(dǎo)地位,并獲得更多收入機會的決心。不過,近日OpenAI還被曝出已經(jīng)向美國國家安全官員展示了“草莓”項目,這可能是這家創(chuàng)企安全部門高管頻繁離職背景下,想要讓產(chǎn)品提高透明度的舉措。本月初,OpenAI CEO Sam Altman在推特暗戳戳秀自家花園5顆草莓的時候,就有網(wǎng)友根據(jù)草莓成熟時間跳了預(yù)言家:GPT-5可能在未來4-6周內(nèi)確認(rèn)發(fā)布。這正好和現(xiàn)在秋天可能發(fā)布的時間點對上了。

可能在不久的將來,我們就能看到“草莓”項目被直接集成到了ChatGPT里。

01.穩(wěn)住大模型霸主地位“草莓”能幫新旗艦?zāi)P蜏p少幻覺

“草莓”項目是OpenAI新取得的重要技術(shù)里程碑,能解決以前從未見過的數(shù)學(xué)問題,經(jīng)過訓(xùn)練可以解決涉及編程的問題,回答產(chǎn)品營銷策略等主觀問題、解決復(fù)雜字謎游戲都可以。

一直沒有浮出水面的“草莓”模型,近段時間沖到大眾視野的跡象變得更加明顯。

除了Altman秀5顆草莓,還有OpenAI研究員Trevor Creech發(fā)文在OpenAI吃晚餐,盤子里是草莓。

新模型腳步可能越來越近的現(xiàn)實情況下,這可能是OpenAI想要保持自己在大模型領(lǐng)域霸主地位的舉措,畢竟它的競爭對手已經(jīng)拿出了不少與OpenAI最新旗艦?zāi)P虶PT-4性能相當(dāng)?shù)哪P汀?/p>

盡管目前OpenAI的模型仍是企業(yè)和AI應(yīng)用程序開發(fā)者的首選,但來自谷歌、xAI、Anthropic和Meta等其他企業(yè)的模型正在諸多排行榜上迅速趕上OpenAI。

因此,OpenAI的前景在一定程度上取決于它最終能否推出一款代號為Orion的新旗艦?zāi)P?。該模型旨在改進其去年年初推出的旗艦?zāi)P虶PT-4,后者于去年年初推出。

而“草莓”項目的發(fā)布就對Orion的訓(xùn)練至關(guān)重要——它可以為Orion生成高質(zhì)量訓(xùn)練數(shù)據(jù),減少幻覺。

“草莓”模型可以幫助OpenAI克服獲取高質(zhì)量數(shù)據(jù)的限制,從而利用從互聯(lián)網(wǎng)上提取的文本或圖像等現(xiàn)實世界數(shù)據(jù)來訓(xùn)練新模型。

智能體創(chuàng)企Minion AI首席執(zhí)行官、GitHub Copilot前首席架構(gòu)師Alex Graveley認(rèn)為,使用“草莓”模型生成更高質(zhì)量的訓(xùn)練數(shù)據(jù)可以幫助OpenAI減少其模型產(chǎn)生的錯誤數(shù)量,即所謂的幻覺。該模型之所以能夠做到這一點,是因為“訓(xùn)練數(shù)據(jù)中的歧義較少,所以它猜測的次數(shù)較少”。

除了下一代旗艦?zāi)P停安葺表椖康耐瞥鲆材?strong>改進OpenAI的現(xiàn)有產(chǎn)品。OpenAI內(nèi)部正在通過“提煉”過程來簡化和縮小“草莓”模型,以便在Orion發(fā)布之前將其用于提升現(xiàn)有產(chǎn)品的性能。這種“草莓”模型的較小、簡化版本,能夠在保持與較大模型相同性能水平的同時,更易于操作且成本更低。

一個顯而易見的想法是將“草莓”模型改進的推理能力融入ChatGPT中。這可能意味著用戶雖然獲得了更準(zhǔn)確的答案,但速度會變慢。

因此,這可能不適用于SearchGPT搜索引擎等用戶希望能獲得立即響應(yīng)的工具,但非常適合對時間不太敏感的用例,例如修復(fù)GitHub中的非關(guān)鍵編碼錯誤。

那是不是在不久的將來,ChatGPT用戶能夠根據(jù)請求的時間敏感度來自主選擇打開或關(guān)閉“草莓”模型。

02.OpenAI收入告急?今年夏天已向政府官員展示

面對資金實力雄厚的科技大公司以及瘋狂吸金的創(chuàng)企勁敵,OpenAI需要開辟更多的收入機會。

盡管相比于一年前OpenAI業(yè)務(wù)增長飛速,目前其向企業(yè)銷售的API和ChatGPT訂閱收入增長了約兩倍,達到每月2.83億美元,但OpenAI每月的虧損可能更高。The Information基于此前未披露的內(nèi)部財務(wù)數(shù)據(jù)和參與該業(yè)務(wù)的人士的分析,OpenAI今年可能虧損高達50億美元。

知情人士透露,Altman希望為公司籌集更多資金,并尋找減少損失的方法。作為與微軟達成商業(yè)合作的一部分,OpenAI自2019年以來已從微軟籌集了約130億美元,該合作將持續(xù)到2030年。但合作條款可能會發(fā)生變化,包括OpenAI如何向微軟支付租用云服務(wù)器的費用以開發(fā)其模型,這也是目前是OpenAI最大的成本支出。

鑒于現(xiàn)有的ChatGPT等對話式AI在航空航天和結(jié)構(gòu)工程等數(shù)學(xué)密集型領(lǐng)域并不擅長,解決棘手?jǐn)?shù)學(xué)問題的模型可能是一個潛在的有利可圖的應(yīng)用。同時,數(shù)學(xué)推理的改進也可以幫助模型更好地推理對話查詢,例如客戶服務(wù)請求。

谷歌和一些初創(chuàng)公司也在開發(fā)推理技術(shù)。上個月,谷歌DeepMind的模型在國際數(shù)學(xué)奧林匹克競賽中擊敗了大多數(shù)人類參賽者;Anthropic最新的模型可以編寫更復(fù)雜的代碼、回答有關(guān)圖表和圖形的能力;還有一些創(chuàng)企通過將問題分解為更小的步驟來提高推理能力,但這種方法速度慢且成本更高……

因此,“草莓”模型的發(fā)布可能會為推理技術(shù)帶來新的思路。

Altman今年5月就曾透露“我們覺得我們擁有足夠的數(shù)據(jù)來開發(fā)下一個模型。我們已經(jīng)進行了各種實驗,包括生成合成數(shù)據(jù)?!彼?dāng)時可能指的就是Orion模型。

一位直接知情人士稱,OpenAI在今年夏天向國家安全官員展示了“草莓”模型的能力。

此次演示可能是OpenAI努力向美國政策制定者提高透明度的一部分,近幾個月來,OpenAI聯(lián)合創(chuàng)始人之一John Schulman等幾位安全部門的高管離職,這也使得業(yè)界對于OpenAI的技術(shù)安全更加關(guān)注。

03.結(jié)語:OpenAI尋求開辟更多收入機會

推出“草莓”模型是OpenAI是在大模型產(chǎn)業(yè)中永無止境的戰(zhàn)斗的一部分,它要領(lǐng)先于其他資金雄厚的競爭對手,穩(wěn)固自己在大模型領(lǐng)域的霸主地位。此外,這項技術(shù)還對未來的產(chǎn)品產(chǎn)生影響,如解決多步驟任務(wù)的智能體等。

OpenAI等大模型玩家同樣希望借此能在這一領(lǐng)域開辟出更多的收入機會,以支持高昂的大模型訓(xùn)練費用。

推薦器件

更多器件
器件型號 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊 ECAD模型 風(fēng)險等級 參考價格 更多信息
STM32F401VET6 1 STMicroelectronics High-performance access line, Arm Cortex-M4 core with DSP and FPU, 512 Kbytes of Flash memory, 84 MHz CPU, ART Accelerator

ECAD模型

下載ECAD模型
$10.53 查看
STM32F407VGT6 1 STMicroelectronics High-performance foundation line, Arm Cortex-M4 core with DSP and FPU, 1 Mbyte of Flash memory, 168 MHz CPU, ART Accelerator, Ethernet, FSMC

ECAD模型

下載ECAD模型
$20.39 查看
ATMEGA328P-MU 1 Microchip Technology Inc IC MCU 8BIT 32KB FLASH 32VQFN

ECAD模型

下載ECAD模型
$2.5 查看

相關(guān)推薦

電子產(chǎn)業(yè)圖譜