桃子视频免费完整版在线观看,谁动了我的可乐小说

作者：豐寧

在AI領(lǐng)域，GPU的主要應(yīng)用場(chǎng)景有兩個(gè)，第一個(gè)是訓(xùn)練場(chǎng)景，即利用GPU加速AI算法的訓(xùn)練。第二個(gè)場(chǎng)景是推理場(chǎng)景，即利用GPU加速AI算法推理。目前，國(guó)內(nèi)高端AI場(chǎng)景中的GPU應(yīng)用基本上都由英偉達(dá)的A800覆蓋。

A800被視為是A100的“閹割版”。去年由于美國(guó)政府收緊對(duì)華出口管制，英偉達(dá)迅速推出數(shù)據(jù)傳輸速度相對(duì)較慢的A800，用來(lái)代替A100向中國(guó)出口，與此類似的還有更高端的英偉達(dá)H100和H800。

由于中國(guó)暫時(shí)沒有能力提供用于云端AI訓(xùn)練的高性能GPU，因此A800迎來(lái)中國(guó)互聯(lián)網(wǎng)巨頭的青睞。

?01全球芯片巨頭，囤積GPU

據(jù)報(bào)道，中國(guó)的互聯(lián)網(wǎng)巨頭百度、騰訊、阿里巴巴以及字節(jié)跳動(dòng)公司今年向英偉達(dá)下達(dá)的交付訂單金額達(dá)到10億美元，總共采購(gòu)約10萬(wàn)張A800芯片；明年交付的AI芯片價(jià)值更是達(dá)到40億美元。

可見，中國(guó)大型科技公司對(duì)于GPU采購(gòu)非常急迫。不止國(guó)內(nèi)企業(yè)，國(guó)外大客戶對(duì)英偉達(dá)的A100/H100芯片需求同樣非常強(qiáng)烈。

近來(lái)，社區(qū)廣為流傳的一張圖“我們需要多少?gòu)圙PU”，引發(fā)了眾多網(wǎng)友的討論。

根據(jù)圖中內(nèi)容所示：GPT-4可能在大約10000—25000張A100上進(jìn)行訓(xùn)練；Meta大約需要21000張A100；Tesla大約需要7000張A100；Stability AI大約需要5000張A100；Falcon-40B在384張A100上進(jìn)行了訓(xùn)練；Inflection使用了3500張H100，來(lái)訓(xùn)練與GPT-3.5能力相當(dāng)?shù)哪Ｐ?。另外，根?jù)馬斯克的說(shuō)法，GPT-5可能需要30000—50000張H100。

面對(duì)如此強(qiáng)大的需求，英偉達(dá)的GPU陷入極度短缺。據(jù)外媒報(bào)道，供應(yīng)鏈消息顯示，在生成式人工智能需求高漲以及國(guó)際形勢(shì)變化等因素影響下，英偉達(dá)專供中國(guó)市場(chǎng)的A800和H800 GPU價(jià)格持續(xù)攀升。7月中旬，英偉達(dá)代理商反饋，英偉達(dá)的A800 GPU單價(jià)漲至12萬(wàn)元，H800和H100報(bào)價(jià)也都超過(guò)20萬(wàn)。目前英偉達(dá)訂單能見度已至2024年，以現(xiàn)在的排產(chǎn)進(jìn)度，就連A800/H800都要到今年底或明年才能交貨。

?02產(chǎn)量瓶頸在哪里？

據(jù)tomshardware報(bào)道，英偉達(dá)DGX系統(tǒng)副總裁兼總經(jīng)理Charlie Boyle出面澄清了該公司GPU產(chǎn)量問(wèn)題的具體所在。Charlie Boyle表示，問(wèn)題并非來(lái)自英偉達(dá)錯(cuò)誤計(jì)算需求，或其制造合作伙伴臺(tái)積電的晶圓產(chǎn)量問(wèn)題。相反，制造足夠的GPU來(lái)滿足消費(fèi)者和專業(yè)工作負(fù)載（比如AI）的瓶頸在于隨后的芯片封裝步驟。

英偉達(dá)的H系列GPU采用臺(tái)積電的2.5D CoWoS封裝技術(shù)，這是一種多步驟、高精度的工程流程，其復(fù)雜性降低了在給定時(shí)間內(nèi)可以組裝的GPU數(shù)量，這可能會(huì)不成比例地影響供應(yīng)。馬斯克也表示“GPU超級(jí)難得”。

因此，當(dāng)人們使用“GPU短缺”這個(gè)詞時(shí)，他們實(shí)際上是在談?wù)撝靼迳夏承┙M件的短缺或積壓，而不是GPU本身。

在芯片成為可用的GPU之前，需要執(zhí)行從芯片設(shè)計(jì)到制造的多個(gè)步驟。芯片設(shè)計(jì)階段的問(wèn)題可能會(huì)因設(shè)計(jì)疏忽而造成制造瓶頸，從而降低設(shè)計(jì)的良率。稀土金屬或其他材料（例如最近受到限制的鎵）的缺乏將影響長(zhǎng)物流鏈中的其他步驟；材料污染、能源中斷和許多其他因素也會(huì)造成影響。

但CoWoS的瓶頸問(wèn)題可能比預(yù)想的更嚴(yán)重。臺(tái)積電也表示，預(yù)計(jì)需要一年半（以及完成額外晶圓廠和擴(kuò)建現(xiàn)有設(shè)施）才能使封裝訂單積壓恢復(fù)正常。這可能意味著英偉達(dá)將不得不決定將哪些封裝能力分配給哪些產(chǎn)品，因?yàn)樗鼪]有足夠的時(shí)間和能力來(lái)封裝所有產(chǎn)品。

不僅如此，為限制中國(guó)AI產(chǎn)業(yè)的發(fā)展，美國(guó)總統(tǒng)拜登在今年8月正式簽署行政命令，限制美國(guó)企業(yè)未來(lái)在敏感技術(shù)的對(duì)華投資，涵蓋半導(dǎo)體、量子計(jì)算和人工智能三大領(lǐng)域，預(yù)計(jì)將于明年實(shí)施。

產(chǎn)量不足尚且可破，倘若切斷供應(yīng)，極有可能使這些正在進(jìn)行云端AI訓(xùn)練的大廠陷入困局，也正因此，這些科技巨頭開始競(jìng)相囤積 A800 芯片。仍需重視的是，倘若A800/H800當(dāng)真受到美國(guó)禁令的影響，中國(guó)本土芯片公司以及那些正在自研芯片的科技大廠是否有能力擔(dān)此重任？

?03運(yùn)行大模型，國(guó)產(chǎn)GPGPU有哪些可選標(biāo)的？

如今，美國(guó)實(shí)施新的許可要求，限制中國(guó)利用高端GPU獲取先進(jìn)計(jì)算能力，由于被限制的是近兩年商用領(lǐng)域最先進(jìn)的GPU產(chǎn)品，暫時(shí)沒有可以全面替代的選擇。因此，美國(guó)政府認(rèn)為，切斷中國(guó)從美國(guó)公司獲取這些芯片的直接渠道，可以為中國(guó)人工智能的發(fā)展制造障礙，遲滯中國(guó)人工智能的發(fā)展，希望中國(guó)人工智能領(lǐng)域由此一蹶不振。

然而事實(shí)呢？事實(shí)是禁令一出美國(guó)企業(yè)的股票遇冷下行，生產(chǎn)類似芯片的中國(guó)企業(yè)的股票卻呈現(xiàn)相反的上行態(tài)勢(shì)。這也意味著作為美國(guó)企業(yè)戰(zhàn)略競(jìng)爭(zhēng)者的中國(guó)企業(yè)或許能夠獲得更大的發(fā)展空間。

其實(shí)從2019年開始，應(yīng)用于超算領(lǐng)域的高端GPU售至中國(guó)就受到嚴(yán)格管制，但當(dāng)時(shí)只是AMD產(chǎn)品受限，英偉達(dá)的產(chǎn)品并未受到影響，因此企業(yè)和消費(fèi)者在產(chǎn)品端的感知也并不強(qiáng)。而這一次范圍擴(kuò)大之后，其主要應(yīng)用場(chǎng)景除了超算中心之外，還包括云計(jì)算服務(wù)器、數(shù)據(jù)中心、AI訓(xùn)練等場(chǎng)景，許多互聯(lián)網(wǎng)大廠也就受到了影響。

正因?yàn)橛辛饲败囍b，隨著國(guó)內(nèi)云計(jì)算以及互聯(lián)網(wǎng)企業(yè)在云端存儲(chǔ)、數(shù)據(jù)處理等方面需要的數(shù)據(jù)量越來(lái)越多，各大互聯(lián)網(wǎng)公司、云廠商也在AI芯片領(lǐng)域進(jìn)行布局。

2019年阿里推出人工智能芯片“含光800”，“含光800”是一款面向數(shù)據(jù)中心AI應(yīng)用的人工處理推理芯片，采用臺(tái)積電12nm 制程，這是一顆為AI場(chǎng)景深度定制的芯片，進(jìn)一步提升了AI場(chǎng)景計(jì)算的效率。阿里曾表示，“含光800”是當(dāng)時(shí)全球最強(qiáng)的AI芯片，性能和能效比均為第一，1顆“含光800”的算力相當(dāng)于10顆GPU。目前已應(yīng)用在阿里云的云服務(wù)器中，它能夠優(yōu)化電商智能搜索、智能營(yíng)銷等場(chǎng)景。阿里“含光800”雖然不對(duì)外售賣，但阿里云智能總裁張建峰也提到“含光800”將通過(guò)阿里云對(duì)外輸出 AI 算力，未來(lái)企業(yè)可以通過(guò)阿里云獲取“含光800”的算力。

百度也在2020年量產(chǎn)了第一代AI芯片——昆侖。百度昆侖1采用三星14nm制程工藝，目前量產(chǎn)超過(guò)2萬(wàn)片，在百度搜索引擎和百度智能云生態(tài)伙伴等場(chǎng)景廣泛部署。百度昆侖2于2021年下半年實(shí)現(xiàn)量產(chǎn)，采用7nm先進(jìn)工藝，其性能比百度昆侖1再提升3倍。據(jù)悉，百度正在做第三款昆侖芯片，將于明年的年初上市。

稍微慢一點(diǎn)的騰訊也在2021年發(fā)布了視頻處理芯片“滄?！焙虯I芯片“紫霄”。字節(jié)在“2022 火山引擎原動(dòng)力大會(huì)”上也正式確認(rèn)了其在自主造芯方面的布局。目前，字節(jié)的自研芯片已經(jīng)涉足視頻平臺(tái)、信息和娛樂應(yīng)用等。

目前為止，國(guó)內(nèi)互聯(lián)網(wǎng)大廠的芯片研發(fā)方向都集中在云計(jì)算、視頻圖像處理等方面的專用或者通用芯片上。除了互聯(lián)網(wǎng)大廠，國(guó)內(nèi)也已經(jīng)有一些GPU廠商源源不斷的發(fā)布一些性能優(yōu)異的產(chǎn)品。

目前全球AI計(jì)算芯片主要分為GPGPU、ASIC、FPGA三種架構(gòu)。而被限制的A800和H800芯片就屬于GPGPU架構(gòu)芯片。目前能運(yùn)行大模型訓(xùn)練的也只有GPGPU架構(gòu)。

當(dāng)前國(guó)內(nèi)AI芯片主要廠商包括華為、寒武紀(jì)、海光信息、遂原、壁仞、天數(shù)智芯等，此外龍芯也在布局。其中，發(fā)力GPGPU芯片的包括海光、壁仞科技、沐曦科技、龍芯等等。

海光的深算一號(hào)采用的就是GPGPU架構(gòu)，是公司DCU 系列的主要在售產(chǎn)品。

國(guó)內(nèi)的廠商中海光信息從實(shí)際量產(chǎn)的技術(shù)上來(lái)講是第一梯隊(duì)，其深算一號(hào)可以用來(lái)運(yùn)行大模型，在2022 年度實(shí)現(xiàn)了在大數(shù)據(jù)處理、人工智能、商業(yè)計(jì)算等領(lǐng)域的商業(yè)化應(yīng)用。不過(guò)其整體性能只相當(dāng)于英偉達(dá)P100的水平，大約是英偉達(dá)2014年的技術(shù)水平。不過(guò)，其深算二號(hào)、三號(hào)也處于研發(fā)階段，海光稱其產(chǎn)品性能在國(guó)內(nèi)處于領(lǐng)先地位。

壁仞科技在2022年發(fā)布了首款GPGPU芯片BR100系列，性能方面超越英偉達(dá)A100。BR100 系列通用 GPU 芯片支持云端訓(xùn)練和推理，目前已經(jīng)到了收尾階段，正準(zhǔn)備流片。壁仞科技的第二款芯片也已經(jīng)開始啟動(dòng)架構(gòu)設(shè)計(jì)，之后壁仞科技還將逐步推出面向智算中心、云游戲、邊緣計(jì)算的GPU芯片。至于未來(lái)量產(chǎn)應(yīng)用情況暫時(shí)存疑。還需重視的是，對(duì)于國(guó)內(nèi)初創(chuàng)GPGPU公司而言，軟件生態(tài)更為重要。目前國(guó)內(nèi)的初創(chuàng)公司雖然在細(xì)分領(lǐng)域上有一定的落地，而真正在大模型訓(xùn)練上能有實(shí)際應(yīng)用的還非常欠缺。倘若未來(lái)BR100的實(shí)際應(yīng)用效果還不錯(cuò)，那么在軟件生態(tài)上還需加把勁。

沐曦也是國(guó)內(nèi)GPGPU的選手之一。沐曦公司旗下主要有曦思和曦云兩款A(yù)I芯片，其中曦云MXC系列是該公司研發(fā)的用于AI訓(xùn)練及通用計(jì)算的GPU芯片。MXC500是沐曦對(duì)標(biāo)A100/A800的算力芯片，F(xiàn)P32浮點(diǎn)性能可達(dá)15TFlops，作為對(duì)比的是A100顯卡FP32 性能19.5 TFLOPS。除了性能接近之外，MXC500的完整軟件棧（MXMACA）還兼容CUDA，預(yù)計(jì)年底規(guī)模出貨。

龍芯目前暫無(wú)產(chǎn)品發(fā)布，目前進(jìn)展為已經(jīng)完成相關(guān)IP的設(shè)計(jì)，正在驗(yàn)證優(yōu)化過(guò)程中，第一個(gè)集成自研GPGPU核的SOC芯片計(jì)劃于2024年Q1流片。從流片到量產(chǎn)，如果按最快6—12個(gè)月來(lái)算，龍芯的GPGPU產(chǎn)品至少也要在2024年Q3以后才能發(fā)布，量產(chǎn)估計(jì)需要在2025年了。

另外，華為昇騰也十分被看好。華為的昇騰910也能拿來(lái)當(dāng)訓(xùn)練芯片，其算力強(qiáng)悍，超英偉達(dá)的Tesla V100一倍。但是由于昇騰910依賴華為自身軟件生態(tài)、需要華為深度優(yōu)化及代碼移植，通用性相對(duì)要差一些，且其采用臺(tái)積電的7nm制程，在制造上也受到限制，因此暫不做過(guò)多討論。

?04英偉達(dá)是最優(yōu)選，但不能視為唯一選

如今GPU缺口還在加速擴(kuò)大，倘若A800/H800也受到供應(yīng)限制，那么中國(guó)的云服務(wù)器廠商一定要提前謀劃一條自主的發(fā)展路徑。

中國(guó)AI芯片廠商正從原來(lái)強(qiáng)調(diào)算力和獨(dú)特技術(shù)的傾向逐漸向針對(duì)特定應(yīng)用場(chǎng)景而優(yōu)化的方向轉(zhuǎn)變。雖然微軟、谷歌以及百度現(xiàn)在將AI拿來(lái)聊天畫畫，但不代表他們的AI不能做其他事情。當(dāng)下讓AI落地在民用市場(chǎng)不但能使廠商利用AI獲得更多的收入，特別是微軟、谷歌和百度都有不小的廣告業(yè)務(wù)，另一方面讓用戶更直觀的體驗(yàn)到AI，在民用市場(chǎng)采集更多的數(shù)據(jù)進(jìn)行訓(xùn)練亦能反哺云端場(chǎng)景的應(yīng)用。這個(gè)過(guò)程可能會(huì)長(zhǎng)一點(diǎn)，慢一點(diǎn)，但是這也是一定要做的事情。

同樣，倘若無(wú)法與中國(guó)進(jìn)行貿(mào)易，美國(guó)企業(yè)也要承受巨大損失。A800和H800這些GPU就是英偉達(dá)為了繞過(guò)美國(guó)對(duì)中國(guó)施行的出口禁令所開發(fā)，以此維持其在中國(guó)市場(chǎng)的地位。英偉達(dá)此前透露，下半年他們能夠供應(yīng)更多的GPU，但是沒有提供任何定量的信息。英偉達(dá)首席財(cái)務(wù)官Colette Kress此前在2023年2月至4月的財(cái)報(bào)電話會(huì)議上透露：“我們正在處理本季度的供應(yīng)，但我們也為下半年采購(gòu)了大量生產(chǎn)材料。我們相信下半年的供應(yīng)量將大大高于上半年?！?/p>

對(duì)于中國(guó)的市場(chǎng)現(xiàn)狀來(lái)說(shuō)，英偉達(dá)GPU確是最優(yōu)選，但長(zhǎng)久來(lái)看并不能將其視為唯一選。

器件型號(hào)	數(shù)量	器件廠商	器件描述	ECAD模型	參考價(jià)格	更多信息
AT90CAN128-16MU	1	Atmel Corporation	RISC Microcontroller, 8-Bit, FLASH, AVR RISC CPU, 16MHz, CMOS, GREEN, MO-220VMMD3, QFN-64	ECAD模型下載ECAD模型	$7.93	查看
ATMEGA644PA-AUR	1	Microchip Technology Inc	IC MCU 8BIT 64KB FLASH 44TQFP		$4.99	查看
AT91SAM7X512B-AU	1	Microchip Technology Inc	IC MCU 32BIT 512KB FLASH 100LQFP	ECAD模型下載ECAD模型	$13.29	查看

器件型號(hào)

數(shù)量

器件廠商

器件描述

數(shù)據(jù)手冊(cè)

ECAD模型

風(fēng)險(xiǎn)等級(jí)

參考價(jià)格

更多信息

AT90CAN128-16MU

Atmel Corporation

RISC Microcontroller, 8-Bit, FLASH, AVR RISC CPU, 16MHz, CMOS, GREEN, MO-220VMMD3, QFN-64