加入星計劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴散
  • 作品版權(quán)保護
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
  • 推薦器件
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

PerfXCloud 重大更新|開源模型新霸主Reflection 70B上線

09/09 07:15
850
閱讀需 4 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

Matt Shumer宣布推出Reflection 70B,并稱其為世界頂級開源模型。它在MMLU、MATH、IFEval、GSM8K等測試中橫掃全場,各項基準測試成績均超過GPT-4o,還戰(zhàn)勝了405B的Llama 3.1。PerfXCloud(澎峰云)大模型開發(fā)與服務(wù)平臺第一時間支持并在平臺完成上線,趕快來體驗吧!

Reflection 70B

  • 卓越的基準測試性能:Reflection 70B已在多個基準測試中經(jīng)過嚴格測試,包括MMLU和HumanEval。

測試結(jié)果表明,Reflection 70B性能大幅超越Llama模型,并與當前頂尖LLM相抗衡。?具體來說,Reflection 70B在與頂級閉源模型(Claude 3.5 Sonnet,GPT-4o)比較中,表現(xiàn)出色。在MMLU、MATH、IFEval、GSM8K中測試基準上,都擊敗了GPT-4o。

更值得一提的是,僅憑70B參數(shù)徹底擊敗405B的Llama 3.1,差距顯而易見。

  • 「錯誤識別」和「錯誤糾正」能力:Reflection 70B運用Reflection-Tuning的技術(shù),使得模型能夠在最終確定回復(fù)之前,先檢測自身推理的錯誤并糾正。Reflection 70B引入了幾個用于推理和糾錯的特殊token,使用戶能夠以更結(jié)構(gòu)化的方式與模型交互。在推理過程中,模型會在特殊標簽內(nèi)輸出其推理,以便在檢測到錯誤時進行實時糾正。?
  • 增強的CoT(思維鏈)效力:Reflection 70B將規(guī)劃單獨作為一個步驟,利用CoT縝密思考的過程,使得最終輸出結(jié)果更加簡潔明了。這使得該模型在執(zhí)行高精確度要求的任務(wù)時表現(xiàn)出色,因為它將推理分成不同步驟以提高精確度。

PerfXCloud

PerfXCloud是澎峰科技為開發(fā)者和企業(yè)量身打造的AI開發(fā)和部署平臺。它專注于滿足大模型的微調(diào)和推理需求,為用戶提供極致便捷的一鍵部署體驗。

PerfXCloud為算力中心提供大模型AI科學與工程計算的整體運營解決方案,助力算力中心升級成為“AI超級工廠”。

模型廣場圖片

目前,PerfXCloud(澎峰云)已上線Reflection 70B、Yi-Coder 1.5B、Yi-Coder 9B、Stable-diffusion、ChatTTS以及面壁小鋼炮MiniCPM系列等各主流大模型,并面向基石用戶免費開放llama3.1 405B的API調(diào)用接口。趕快注冊申請成為基石用戶來體驗吧!

推薦器件

更多器件
器件型號 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊 ECAD模型 風險等級 參考價格 更多信息
7774 1 Keystone Electronics Corp TAB Terminal,

ECAD模型

下載ECAD模型
$0.47 查看
P410QS333M300AH101 1 KEMET Corporation RC Network,

ECAD模型

下載ECAD模型
$1.83 查看
FDLL4148 1 onsemi High Conductance Fast Diode, 2500-REEL

ECAD模型

下載ECAD模型
$0.11 查看

相關(guān)推薦

電子產(chǎn)業(yè)圖譜