加入星計劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴散
  • 作品版權(quán)保護
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

放棄Nervana推Habana上位,英特爾這次會賭對嗎?

2020/02/06
306
閱讀需 18 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

近日一則消息讓業(yè)界嘩然,英特爾宣布:將結(jié)束在神經(jīng)網(wǎng)絡處理器方面的工作,將重心轉(zhuǎn)向人工智能芯片,而研發(fā) AI 芯片的核心單位就是英特爾去年重金收購的 Habana Labs。

名噪一時的 Nervana 走下神壇,Habana 在開啟另一個時代。這足以證明,為了 AI 時代的勝利,英特爾再一次“壯士斷腕”。

當然,這不是英特爾第一次下決絕之手,遙想當年,英特爾還是存儲芯片市場的老大。

從存儲芯片到CPU戰(zhàn)略轉(zhuǎn)折

1985 年,面對日本廠商的低價競爭,英特爾在存儲芯片市場戰(zhàn)陷入運營危機,業(yè)界都在懷疑英特爾是否能生存下去,以“偏執(zhí)狂”著稱的格魯夫和時任英特爾首席執(zhí)行官摩爾有一段經(jīng)典的對話。

格魯夫問摩爾:如果我們下臺,另選一名新總裁,你認為他會采取什么行動?

摩爾回答:會放棄存儲芯片業(yè)務。

格魯夫反問:那我們?yōu)槭裁床蛔约簞邮郑?/p>

于是英特爾斷然放棄了存儲芯片業(yè)務,將當時還是副業(yè)的微處理器業(yè)務扶上主位,這次轉(zhuǎn)型讓英特爾贏得了 CPU 時代的勝利。到 1992 年,英特爾成為了全球半導體市場的霸主,而當年打敗英特爾的日本企業(yè)卻不見蹤影,這次決策被格魯夫稱為“戰(zhàn)略轉(zhuǎn)折點”,也正是這次轉(zhuǎn)折成就了英特爾后面十年的輝煌。

痛失移動處理器市場的癥結(jié)

時間來到 2010 年,智能手機需求不斷升溫,以高通為首的一大堆移動處理器廠商迅速崛起,但是英特爾并沒有及時作出反應。直到 2011 年,英特爾才宣布用 Atom 系列處理器進入移動芯片領(lǐng)域,人稱“阿童木”系列,而這個寄予厚望的產(chǎn)品線卻讓英特爾敗走移動處理器市場。

和其它廠商采用 Arm 架構(gòu)大相徑庭,英特爾的 Atom 系列堅持采用了 x86 架構(gòu),而且 Atom Z2580 和 Android 系統(tǒng)出現(xiàn)了嚴重的兼容性問題,給消費者留下了極差的印象。讓用戶不解的是,在 2013 年,當高通和聯(lián)發(fā)科采用 28nm 推出了驍龍 801 和 MT6592 時,Atom Z2580 還在采用 32nm,x86 架構(gòu)本來在功耗上就處于劣勢,落后的工藝制程讓 Atom 處理器的功耗和封裝體積問題雪上加霜;到 2015 年,主流移動處理器廠商紛紛奔向 20nm、14nm,而英特爾推出的 Atom Z3580 依然堅守在了 22nm。如果是 Fabless 廠商出現(xiàn)這種情況我們可以理解,但是發(fā)生在擁有代工廠的英特爾身上真是讓人大跌眼鏡。

更讓人匪夷所思的是,當時英特爾的桌面處理器已經(jīng)量產(chǎn)了 14nm 芯片,可見英特爾在自我博弈,想要拿到移動處理器市場,也不想讓 PC 產(chǎn)品失去優(yōu)勢。然而,魚與熊掌不可兼得,即使后面英特爾散錢式補貼平板電腦市場都沒能挽救 Atom 系列被移動處理器拋棄的命運。

隨后不甘心的英特爾又為移動處理器市場打造了兩款產(chǎn)品 --Broxton 和 SoFIA,Broxton 面向高端移動產(chǎn)品,采用全新的 Goldmont 架構(gòu)、14nm 工藝制造,原計劃在 2015 年中旬推出;SoFIA 面向低端移動產(chǎn)品,宣稱是 Intel 首款整合有基帶芯片的移動 SoC,在 2014 年下半年推出了搭載 3G 基帶的第一代產(chǎn)品,原計劃在 2015 年推出的帶有 4G 基帶的 SoC,但是這兩款產(chǎn)品都無緣上市。

最終,在 2016 年 5 月,英特爾正式對外宣布全面取消 Broxton 和 SoFIA 兩款凌動處理器產(chǎn)品線的開發(fā),放棄移動芯片市場,此時英特爾在移動處理器芯片市場的投入已經(jīng)超過 100 億美金。

筆者百思不得其解:英特爾為什么死守復雜指令集(CISC)(也就是 x86 架構(gòu)),而不選擇更適合移動處理器市場的精簡指令集(RISC)呢?直到我看到另一個故事才恍然大悟。

英特爾不是沒有擁戴過精簡指令集,早在格魯夫“執(zhí)政”時代,英特爾就發(fā)現(xiàn) RISC 能夠用較少的晶體管完成絕大多數(shù)計算任務,負責計算技術(shù)的工程師們也曾為其優(yōu)越的性能歡欣鼓舞,甚至格魯夫還親自為 RISC 推波助瀾。

當時任英特爾高層主管 Craig Kinnie 和 Dennis Carter 找到格魯夫嚴厲指出:安迪,你不能這么干。放棄 CISC 上馬 RISC,將斷送商業(yè)史上最大的特許經(jīng)營生意,而得到的是一大堆競爭對手。

最終,格魯夫被說服了,事后他十分感慨:我們差點兒就葬送了公司,我們的技術(shù)是行業(yè)標準。這個特許經(jīng)營業(yè)務價值超過百億美元。而我卻由于一個漂亮新產(chǎn)品的誘惑而忘記市場,差點兒就把生意白白斷送掉。

這段故事或許就是英特爾堅守復雜指令集的最大原因,但是當年的成功經(jīng)驗在移動處理器市場并沒有奏效,反而讓英特爾節(jié)節(jié)敗退,最后無疾而終?;蛟S在移動處理器市場的失敗也會給英特爾帶來某些啟示。

AI成就英偉達,英特爾棋逢對手

轉(zhuǎn)眼到了 AI 時代,對處理復雜運算和并行運算的天然優(yōu)勢讓英偉達和它的 GPU 站在了聚光燈下。雖然現(xiàn)在 AI 芯片已經(jīng)遍地開花,創(chuàng)業(yè)公司不斷涌現(xiàn),但是 AI 芯片市場依然是英偉達的 GPU 獨霸江湖,其產(chǎn)品在圖形處理方面占有據(jù)對優(yōu)勢,市場占有率高達一半以上,英特爾可謂棋逢對手。

業(yè)界預測,AI 芯片市場規(guī)模在 2022 年將達到 352 億美元。英特爾自己也預測,2024 年 AI 芯片市場規(guī)模將超過 250 億美元。作為處理器市場的老大,英特爾自然不肯放過 AI 這塊肥肉。不過此時的英特爾已經(jīng)意識到,僅憑自己砸錢研發(fā)難以追趕技術(shù)的發(fā)展,于是它選擇了通過收購快速擴張:

2016 年 8 月,英特爾以 4.08 億美元的價格收購 AI 創(chuàng)業(yè)公司 Nervana Systems。Nervana 成立于 2014 年,其產(chǎn)品是神經(jīng)網(wǎng)絡芯片,產(chǎn)品架構(gòu)設計很有特色,針對 AI 需要高性能內(nèi)存的特點放棄了標準緩存系統(tǒng),改用軟件管理內(nèi)存系統(tǒng)。收購 Nervana 之后,英特爾將技術(shù)進行整合推出了多款 Nervana AI 芯片,主要有 Nervana NNP-T 及 Nervana NNP-I 這兩款。

2016 年,英特爾還收購了另外一家 AI 芯片公司 movidus。movidus 成立于 2006 年,花費九年時間研發(fā)了低價低功耗高性能的視覺處理器芯片——Myriad 系列 VPU,而在被英特爾收購之前,其產(chǎn)品就已經(jīng)應用于谷歌和大疆的產(chǎn)品中。

2018 年,英特爾收購了 AI 初創(chuàng)公司 Vertex.ai。Vertex.ai 專注于開發(fā)深度學習匯編工具和相關(guān)技術(shù)。Vertex.ai 聯(lián)合創(chuàng)始人宗 - 恩格(Choong Ng)曾表示,他們看到性能強大的 CPU 和 GPU 存在缺乏便攜式、對開發(fā)者友好工具的問題,而他們則發(fā)現(xiàn)了利用新軟件 PlaidML 引擎解決針對所有平臺的兼容性和便攜性的問題。被收購后,Vertex.ai 并入英特爾 Movidius 部門,PlaidML 在 Apache 2.0 開源授權(quán)項目下使用英特爾的 nGraph 編譯器后臺繼續(xù)支持一系列硬件

英偉達憑借 GPU 在 AI 市場所向披靡,讓英特爾陣陣刺痛,這也激發(fā)了英特爾研發(fā) GPU 的決心。2019 年 2 月,英特爾收購了印度初創(chuàng)公司 Ineda Systems,這家公司是由海德拉巴市連續(xù)創(chuàng)業(yè)家 Gude Dasaradha 于 2011 年創(chuàng)立,進行人工智能、自動駕駛物聯(lián)網(wǎng)技術(shù)開發(fā),2013 年至 2014 年間,該公司因設計和開發(fā)用于可穿戴設別的低功耗 SoC 芯片而聞名。重點在于,此次收購令英特爾從 Ineda 公司吸納超過 100 名具備圖形開發(fā)技術(shù)的工程師。英特爾表示,本次交易有助于自己打造世界級的獨立 GPU 產(chǎn)品。

對于 AI 市場,英特爾可謂不惜重金布局,處處圈地,勢在必得。

Habana Labs:為了被收購而生

Habana Labs 這家公司可謂以技術(shù)取勝,在 2018 年就發(fā)布了推理處理器 Goya,而這個產(chǎn)品簡直就是為了被英特爾收購而打造的。筆者第一次采訪 Habana Labs 是在 2019 年 6 月,其首席商務官 Eitan Medina 向與非網(wǎng)介紹,基于 Goya HL-1000 處理器的 PCIe 卡可基于 ResNet-50 推理基準實現(xiàn)每秒 15000 張圖片的吞吐量,延遲時間為 1.3 毫秒,功耗僅為 100 瓦,主要應用于數(shù)據(jù)中心

讓筆者吃驚的是,Habana 的 Goya 產(chǎn)品直接對標的就是英偉達的 Tesla T4,從對比圖上可以看出,Goya 的性能是 Tesla T4 的三倍;從能耗上來看,比 GPU 有兩倍的優(yōu)勢;在實時處理上,延遲也比 GPU 要低很多。與傳統(tǒng)的 CPU 對比,8 片 V100 GPU 的性能等同于 169 片傳統(tǒng) CPU 的處理能力,而 3 片 Goya 處理器就可以達到 8 片 V100 的處理效果。

如果我是英特爾,看到 Goya 的性能也會心動的。

Goya 產(chǎn)品與 Tesla T4 的對比

在架構(gòu)方面,Habana 設計了一款叫做 Tensor processor core(張量處理核心)的架構(gòu),其中設有一個矩陣乘加家族單元,這種架構(gòu)讓 Goya 支持不同的神經(jīng)網(wǎng)絡結(jié)構(gòu),可以處理不同類型的數(shù)據(jù)。大家應該還記得將 AI 推向風口浪尖的 AlphaGo,殊不知 AlphaGo 的高配版本使用了 1920 個 CPU 和 280 個 GPU,可想而知,能效是谷歌必須要解決的問題。為了設計更高效、更低能耗的芯片,谷歌選擇了張量處理器(TPU)的自主研發(fā)。Habana 的設計方法和谷歌的 TPU 出奇的一致。

當時,我就預感 Habana 將會很快成為大公司的收購目標,當我了解了 Eitan Medina 的創(chuàng)業(yè)經(jīng)歷后更加篤定。Eitan Medina 在加入 Habana 公司之前有三段工作經(jīng)歷,都和收購有關(guān),他曾在 InvenSense 擔任市場營銷副總裁,后被 TDK 收購;在 Audience Inc 擔任工程副總裁,后被 Knowles 收購;在 Galileo 擔任首席技術(shù)官,后被美滿電子收購。果然,Habana Labs 于 2019 年被英特爾收購,成就了 Eitan Medina 的第四段被收購經(jīng)歷。

Nervana 壯士斷腕,Habana上位對AI市場勢在必得

自從被收購以后 Nervana 就少有產(chǎn)品發(fā)布,外界一直在猜測:Nervana 是不是銷聲匿跡了? 在 2019 人工智能峰會上,英特爾發(fā)布了兩款 AI 芯片(Nervana 神經(jīng)網(wǎng)絡處理器)NNP-T 和 NNP-I。其中,NNP-T 代號 SpringCrest,用于訓練,NNP-I 代號 SpringHill,用于推理。 NNP-T 代號 SpringCrest ,基于臺積電 16nm FF+制程,在 680 平方毫米的硅片面積上集成 270 億個晶體管,可以從頭開始構(gòu)建大規(guī)模深度學習模型;NNP-I 代號 SpringHill, 基于 10nm 制程和 Ice Lake 內(nèi)核,專門用于大型數(shù)據(jù)中心的推理芯片,可以加速大規(guī)模深度學習部署。

在去年年底在北京舉辦的英特爾 AI 峰會上,Nervana 團隊終于又發(fā)聲了,而且?guī)砹诵乱淮?Movidius VPU,計劃在 2020 年上半年推出,代號為 KEEM BAY。英特爾的 AI 市場營收也交出了一份不錯的答卷:35 億美金。這個數(shù)字相對未來幾年近 300 億的 AI 芯片市場,顯然還是太小,英特爾需要繼續(xù)發(fā)力。

KEEM BAY 的相關(guān)負責人介紹,其采用了專用架構(gòu),性能高度優(yōu)化,針對邊緣推理,在性能上有巨大提升。在處理速度上,KEEM BAY 是英偉達 TX2 的 4 倍,而且要比 Ascend 310 快 25%;在能耗上,KEEM BAY 提供的每瓦的推理性能是英偉達 TX2 的 6 倍,每一平方毫米的推理性能是英偉達 TX2 的 8.7 倍。

KEEM BAY 的參數(shù)到底是什么水平呢?我去查了一下英偉達 TX2 的技術(shù)參數(shù),GPU 采用 NVIDIA Pascal 架構(gòu),配置 256 個 CUDA 內(nèi)核。再看英偉達的 Tesla T4 ,擁有 320 個圖靈張量(TURring Tensor)內(nèi)核 + 2560 個 CUDA 內(nèi)核,而圖靈張量內(nèi)核(Tensor Cores)的性能是 Pascal 的 5 倍。

按照 Habana 的介紹,Goya 的性能是 Tesla T4 的三倍,如果單從 CUDA 內(nèi)核比較,KEEM BAY 對等 1024 個 CUDA 內(nèi)核,Goya 處理器對等 7680 個 CUDA 內(nèi)核,加上 Tensor Cores 的性能是 Pascal 架構(gòu)的 5 倍,顯然 KEEM BAY 已經(jīng)被秒殺了。即便是面向邊緣推理,KEEM BAY 相對 Goya 也差距太大。關(guān)于 Nervana 的兩款產(chǎn)品,英特爾也承認,客戶和工程師反饋后認為,Spring Hill 和 Spring Crest 的第二代 Nervana 設計,根本無法滿足高性能工作負載的需求。

物競天擇,擇優(yōu)錄用。英特爾作為一個商業(yè)公司不會在一個性能達不到預期的產(chǎn)品上浪費過多的時間和金錢,及時收手,果斷砍掉 Nervana 是必然之舉。

結(jié)語

“只要涉及企業(yè)管理,我就相信偏執(zhí)萬歲。企業(yè)的繁榮中孕育著自我毀滅的種子,你越是成功就越容易遭到對手的攻擊,他們一塊塊地吞食你的生意,最后可能一無所有。我認為,作為一名管理者,最重要的職責就是常常提防他人的襲擊,并把這種防范意識傳播給手下的工作人員。”這段話出自英特爾前 CEO 格魯夫。

是他的偏執(zhí)讓英特爾在 PC 時代走向了輝煌,英特爾成立 70 多年來,一直在轉(zhuǎn)身,一直在抉擇,一直在放手,也一直在收獲,或許這次豪賭會讓英特爾贏得未來的 AI 市場。

Habana

Habana

Habana Labs was founded in 2016 to create world-class AI Processors, developed from the ground-up and optimized for training deep neural networks and for inference deployment in production environments.

Habana Labs was founded in 2016 to create world-class AI Processors, developed from the ground-up and optimized for training deep neural networks and for inference deployment in production environments.收起

查看更多

相關(guān)推薦

電子產(chǎn)業(yè)圖譜