倚天屠龙记2009邓超版,underbelly,japonensis19

近日一則消息讓業(yè)界嘩然，英特爾宣布：將結(jié)束在神經(jīng)網(wǎng)絡處理器方面的工作，將重心轉(zhuǎn)向人工智能芯片，而研發(fā) AI 芯片的核心單位就是英特爾去年重金收購的 Habana Labs。

名噪一時的 Nervana 走下神壇，Habana 在開啟另一個時代。這足以證明，為了 AI 時代的勝利，英特爾再一次“壯士斷腕”。

當然，這不是英特爾第一次下決絕之手，遙想當年，英特爾還是存儲芯片市場的老大。

從存儲芯片到CPU的“戰(zhàn)略轉(zhuǎn)折”

1985 年，面對日本廠商的低價競爭，英特爾在存儲芯片市場戰(zhàn)陷入運營危機，業(yè)界都在懷疑英特爾是否能生存下去，以“偏執(zhí)狂”著稱的格魯夫和時任英特爾首席執(zhí)行官摩爾有一段經(jīng)典的對話。

格魯夫問摩爾：如果我們下臺，另選一名新總裁，你認為他會采取什么行動？

摩爾回答：會放棄存儲芯片業(yè)務。

格魯夫反問：那我們?yōu)槭裁床蛔约簞邮郑?/p>

于是英特爾斷然放棄了存儲芯片業(yè)務，將當時還是副業(yè)的微處理器業(yè)務扶上主位，這次轉(zhuǎn)型讓英特爾贏得了 CPU 時代的勝利。到 1992 年，英特爾成為了全球半導體市場的霸主，而當年打敗英特爾的日本企業(yè)卻不見蹤影，這次決策被格魯夫稱為“戰(zhàn)略轉(zhuǎn)折點”，也正是這次轉(zhuǎn)折成就了英特爾后面十年的輝煌。

痛失移動處理器市場的“癥結(jié)”

時間來到 2010 年，智能手機需求不斷升溫，以高通為首的一大堆移動處理器廠商迅速崛起，但是英特爾并沒有及時作出反應。直到 2011 年，英特爾才宣布用 Atom 系列處理器進入移動芯片領(lǐng)域，人稱“阿童木”系列，而這個寄予厚望的產(chǎn)品線卻讓英特爾敗走移動處理器市場。

和其它廠商采用 Arm 架構(gòu)大相徑庭，英特爾的 Atom 系列堅持采用了 x86 架構(gòu)，而且 Atom Z2580 和 Android 系統(tǒng)出現(xiàn)了嚴重的兼容性問題，給消費者留下了極差的印象。讓用戶不解的是，在 2013 年，當高通和聯(lián)發(fā)科采用 28nm 推出了驍龍 801 和 MT6592 時，Atom Z2580 還在采用 32nm，x86 架構(gòu)本來在功耗上就處于劣勢，落后的工藝制程讓 Atom 處理器的功耗和封裝體積問題雪上加霜；到 2015 年，主流移動處理器廠商紛紛奔向 20nm、14nm，而英特爾推出的 Atom Z3580 依然堅守在了 22nm。如果是 Fabless 廠商出現(xiàn)這種情況我們可以理解，但是發(fā)生在擁有代工廠的英特爾身上真是讓人大跌眼鏡。

更讓人匪夷所思的是，當時英特爾的桌面處理器已經(jīng)量產(chǎn)了 14nm 芯片，可見英特爾在自我博弈，想要拿到移動處理器市場，也不想讓 PC 產(chǎn)品失去優(yōu)勢。然而，魚與熊掌不可兼得，即使后面英特爾散錢式補貼平板電腦市場都沒能挽救 Atom 系列被移動處理器拋棄的命運。

隨后不甘心的英特爾又為移動處理器市場打造了兩款產(chǎn)品 --Broxton 和 SoFIA，Broxton 面向高端移動產(chǎn)品，采用全新的 Goldmont 架構(gòu)、14nm 工藝制造，原計劃在 2015 年中旬推出；SoFIA 面向低端移動產(chǎn)品，宣稱是 Intel 首款整合有基帶芯片的移動 SoC，在 2014 年下半年推出了搭載 3G 基帶的第一代產(chǎn)品，原計劃在 2015 年推出的帶有 4G 基帶的 SoC，但是這兩款產(chǎn)品都無緣上市。

最終，在 2016 年 5 月，英特爾正式對外宣布全面取消 Broxton 和 SoFIA 兩款凌動處理器產(chǎn)品線的開發(fā)，放棄移動芯片市場，此時英特爾在移動處理器芯片市場的投入已經(jīng)超過 100 億美金。

筆者百思不得其解：英特爾為什么死守復雜指令集（CISC）（也就是 x86 架構(gòu)），而不選擇更適合移動處理器市場的精簡指令集（RISC）呢？直到我看到另一個故事才恍然大悟。

英特爾不是沒有擁戴過精簡指令集，早在格魯夫“執(zhí)政”時代，英特爾就發(fā)現(xiàn) RISC 能夠用較少的晶體管完成絕大多數(shù)計算任務，負責計算技術(shù)的工程師們也曾為其優(yōu)越的性能歡欣鼓舞，甚至格魯夫還親自為 RISC 推波助瀾。

當時任英特爾高層主管 Craig Kinnie 和 Dennis Carter 找到格魯夫嚴厲指出：安迪，你不能這么干。放棄 CISC 上馬 RISC，將斷送商業(yè)史上最大的特許經(jīng)營生意，而得到的是一大堆競爭對手。

最終，格魯夫被說服了，事后他十分感慨：我們差點兒就葬送了公司，我們的技術(shù)是行業(yè)標準。這個特許經(jīng)營業(yè)務價值超過百億美元。而我卻由于一個漂亮新產(chǎn)品的誘惑而忘記市場，差點兒就把生意白白斷送掉。

這段故事或許就是英特爾堅守復雜指令集的最大原因，但是當年的成功經(jīng)驗在移動處理器市場并沒有奏效，反而讓英特爾節(jié)節(jié)敗退，最后無疾而終?；蛟S在移動處理器市場的失敗也會給英特爾帶來某些啟示。

AI成就英偉達，英特爾棋逢對手

轉(zhuǎn)眼到了 AI 時代，對處理復雜運算和并行運算的天然優(yōu)勢讓英偉達和它的 GPU 站在了聚光燈下。雖然現(xiàn)在 AI 芯片已經(jīng)遍地開花，創(chuàng)業(yè)公司不斷涌現(xiàn)，但是 AI 芯片市場依然是英偉達的 GPU 獨霸江湖，其產(chǎn)品在圖形處理方面占有據(jù)對優(yōu)勢，市場占有率高達一半以上，英特爾可謂棋逢對手。

業(yè)界預測，AI 芯片市場規(guī)模在 2022 年將達到 352 億美元。英特爾自己也預測，2024 年 AI 芯片市場規(guī)模將超過 250 億美元。作為處理器市場的老大，英特爾自然不肯放過 AI 這塊肥肉。不過此時的英特爾已經(jīng)意識到，僅憑自己砸錢研發(fā)難以追趕技術(shù)的發(fā)展，于是它選擇了通過收購快速擴張：

2016 年 8 月，英特爾以 4.08 億美元的價格收購 AI 創(chuàng)業(yè)公司 Nervana Systems。Nervana 成立于 2014 年，其產(chǎn)品是神經(jīng)網(wǎng)絡芯片，產(chǎn)品架構(gòu)設計很有特色，針對 AI 需要高性能內(nèi)存的特點放棄了標準緩存系統(tǒng)，改用軟件管理內(nèi)存系統(tǒng)。收購 Nervana 之后，英特爾將技術(shù)進行整合推出了多款 Nervana AI 芯片，主要有 Nervana NNP-T 及 Nervana NNP-I 這兩款。

2016 年，英特爾還收購了另外一家 AI 芯片公司 movidus。movidus 成立于 2006 年，花費九年時間研發(fā)了低價低功耗高性能的視覺處理器芯片——Myriad 系列 VPU，而在被英特爾收購之前，其產(chǎn)品就已經(jīng)應用于谷歌和大疆的產(chǎn)品中。

2018 年，英特爾收購了 AI 初創(chuàng)公司 Vertex.ai。Vertex.ai 專注于開發(fā)深度學習匯編工具和相關(guān)技術(shù)。Vertex.ai 聯(lián)合創(chuàng)始人宗 - 恩格（Choong Ng）曾表示，他們看到性能強大的 CPU 和 GPU 存在缺乏便攜式、對開發(fā)者友好工具的問題，而他們則發(fā)現(xiàn)了利用新軟件 PlaidML 引擎解決針對所有平臺的兼容性和便攜性的問題。被收購后，Vertex.ai 并入英特爾 Movidius 部門，PlaidML 在 Apache 2.0 開源授權(quán)項目下使用英特爾的 nGraph 編譯器后臺繼續(xù)支持一系列硬件。

英偉達憑借 GPU 在 AI 市場所向披靡，讓英特爾陣陣刺痛，這也激發(fā)了英特爾研發(fā) GPU 的決心。2019 年 2 月，英特爾收購了印度初創(chuàng)公司 Ineda Systems，這家公司是由海德拉巴市連續(xù)創(chuàng)業(yè)家 Gude Dasaradha 于 2011 年創(chuàng)立，進行人工智能、自動駕駛和物聯(lián)網(wǎng)技術(shù)開發(fā)，2013 年至 2014 年間，該公司因設計和開發(fā)用于可穿戴設別的低功耗 SoC 芯片而聞名。重點在于，此次收購令英特爾從 Ineda 公司吸納超過 100 名具備圖形開發(fā)技術(shù)的工程師。英特爾表示，本次交易有助于自己打造世界級的獨立 GPU 產(chǎn)品。

對于 AI 市場，英特爾可謂不惜重金布局，處處圈地，勢在必得。

Habana Labs：為了“被收購”而生

Habana Labs 這家公司可謂以技術(shù)取勝，在 2018 年就發(fā)布了推理處理器 Goya，而這個產(chǎn)品簡直就是為了被英特爾收購而打造的。筆者第一次采訪 Habana Labs 是在 2019 年 6 月，其首席商務官 Eitan Medina 向與非網(wǎng)介紹，基于 Goya HL-1000 處理器的 PCIe 卡可基于 ResNet-50 推理基準實現(xiàn)每秒 15000 張圖片的吞吐量，延遲時間為 1.3 毫秒，功耗僅為 100 瓦，主要應用于數(shù)據(jù)中心。

讓筆者吃驚的是，Habana 的 Goya 產(chǎn)品直接對標的就是英偉達的 Tesla T4，從對比圖上可以看出，Goya 的性能是 Tesla T4 的三倍；從能耗上來看，比 GPU 有兩倍的優(yōu)勢；在實時處理上，延遲也比 GPU 要低很多。與傳統(tǒng)的 CPU 對比，8 片 V100 GPU 的性能等同于 169 片傳統(tǒng) CPU 的處理能力，而 3 片 Goya 處理器就可以達到 8 片 V100 的處理效果。

如果我是英特爾，看到 Goya 的性能也會心動的。

Goya 產(chǎn)品與 Tesla T4 的對比

在架構(gòu)方面，Habana 設計了一款叫做 Tensor processor core（張量處理核心）的架構(gòu)，其中設有一個矩陣乘加家族單元，這種架構(gòu)讓 Goya 支持不同的神經(jīng)網(wǎng)絡結(jié)構(gòu)，可以處理不同類型的數(shù)據(jù)。大家應該還記得將 AI 推向風口浪尖的 AlphaGo，殊不知 AlphaGo 的高配版本使用了 1920 個 CPU 和 280 個 GPU，可想而知，能效是谷歌必須要解決的問題。為了設計更高效、更低能耗的芯片，谷歌選擇了張量處理器（TPU）的自主研發(fā)。Habana 的設計方法和谷歌的 TPU 出奇的一致。

當時，我就預感 Habana 將會很快成為大公司的收購目標，當我了解了 Eitan Medina 的創(chuàng)業(yè)經(jīng)歷后更加篤定。Eitan Medina 在加入 Habana 公司之前有三段工作經(jīng)歷，都和收購有關(guān)，他曾在 InvenSense 擔任市場營銷副總裁，后被 TDK 收購；在 Audience Inc 擔任工程副總裁，后被 Knowles 收購；在 Galileo 擔任首席技術(shù)官，后被美滿電子收購。果然，Habana Labs 于 2019 年被英特爾收購，成就了 Eitan Medina 的第四段被收購經(jīng)歷。

砍Nervana 壯士斷腕，推Habana上位對AI市場勢在必得

自從被收購以后 Nervana 就少有產(chǎn)品發(fā)布，外界一直在猜測：Nervana 是不是銷聲匿跡了？在 2019 人工智能峰會上，英特爾發(fā)布了兩款 AI 芯片(Nervana 神經(jīng)網(wǎng)絡處理器)NNP-T 和 NNP-I。其中，NNP-T 代號 SpringCrest，用于訓練，NNP-I 代號 SpringHill，用于推理。 NNP-T 代號 SpringCrest ，基于臺積電 16nm FF+制程，在 680 平方毫米的硅片面積上集成 270 億個晶體管，可以從頭開始構(gòu)建大規(guī)模深度學習模型；NNP-I 代號 SpringHill，基于 10nm 制程和 Ice Lake 內(nèi)核，專門用于大型數(shù)據(jù)中心的推理芯片，可以加速大規(guī)模深度學習部署。

在去年年底在北京舉辦的英特爾 AI 峰會上，Nervana 團隊終于又發(fā)聲了，而且?guī)砹诵乱淮?Movidius VPU，計劃在 2020 年上半年推出，代號為 KEEM BAY。英特爾的 AI 市場營收也交出了一份不錯的答卷：35 億美金。這個數(shù)字相對未來幾年近 300 億的 AI 芯片市場，顯然還是太小，英特爾需要繼續(xù)發(fā)力。

KEEM BAY 的相關(guān)負責人介紹，其采用了專用架構(gòu)，性能高度優(yōu)化，針對邊緣推理，在性能上有巨大提升。在處理速度上，KEEM BAY 是英偉達 TX2 的 4 倍，而且要比 Ascend 310 快 25%；在能耗上，KEEM BAY 提供的每瓦的推理性能是英偉達 TX2 的 6 倍，每一平方毫米的推理性能是英偉達 TX2 的 8.7 倍。

KEEM BAY 的參數(shù)到底是什么水平呢？我去查了一下英偉達 TX2 的技術(shù)參數(shù)，GPU 采用 NVIDIA Pascal 架構(gòu)，配置 256 個 CUDA 內(nèi)核。再看英偉達的 Tesla T4 ，擁有 320 個圖靈張量（TURring Tensor）內(nèi)核 + 2560 個 CUDA 內(nèi)核，而圖靈張量內(nèi)核（Tensor Cores）的性能是 Pascal 的 5 倍。

按照 Habana 的介紹，Goya 的性能是 Tesla T4 的三倍，如果單從 CUDA 內(nèi)核比較，KEEM BAY 對等 1024 個 CUDA 內(nèi)核，Goya 處理器對等 7680 個 CUDA 內(nèi)核，加上 Tensor Cores 的性能是 Pascal 架構(gòu)的 5 倍，顯然 KEEM BAY 已經(jīng)被秒殺了。即便是面向邊緣推理，KEEM BAY 相對 Goya 也差距太大。關(guān)于 Nervana 的兩款產(chǎn)品，英特爾也承認，客戶和工程師反饋后認為，Spring Hill 和 Spring Crest 的第二代 Nervana 設計，根本無法滿足高性能工作負載的需求。

物競天擇，擇優(yōu)錄用。英特爾作為一個商業(yè)公司不會在一個性能達不到預期的產(chǎn)品上浪費過多的時間和金錢，及時收手，果斷砍掉 Nervana 是必然之舉。

結(jié)語

“只要涉及企業(yè)管理，我就相信偏執(zhí)萬歲。企業(yè)的繁榮中孕育著自我毀滅的種子，你越是成功就越容易遭到對手的攻擊，他們一塊塊地吞食你的生意，最后可能一無所有。我認為，作為一名管理者，最重要的職責就是常常提防他人的襲擊，并把這種防范意識傳播給手下的工作人員。”這段話出自英特爾前 CEO 格魯夫。

是他的偏執(zhí)讓英特爾在 PC 時代走向了輝煌，英特爾成立 70 多年來，一直在轉(zhuǎn)身，一直在抉擇，一直在放手，也一直在收獲，或許這次豪賭會讓英特爾贏得未來的 AI 市場。