加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
    • 1 物理機(jī)的優(yōu)勢和劣勢
    • 2 虛擬機(jī)的優(yōu)勢和劣勢
    • 3 強(qiáng)強(qiáng)聯(lián)合,物理機(jī)和虛擬機(jī)的優(yōu)勢合并
    • 4 更進(jìn)一步,虛擬機(jī)和裸金屬機(jī)的統(tǒng)一
    • 5 總結(jié)
  • 推薦器件
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

裸金屬和物理機(jī)是一回事嗎?

08/30 09:20
1273
閱讀需 11 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

編者按:跟一些行業(yè)內(nèi)朋友聊天,大家經(jīng)常提到裸金屬機(jī)的概念,實(shí)際上指的是物理機(jī)。與我理解的,如AWS等云廠商提到的,裸金屬(Bare Metal)機(jī),其實(shí)不是一回事。

那什么是裸金屬機(jī)?以及物理機(jī)、虛擬機(jī)及裸金屬機(jī)的優(yōu)勢劣勢、區(qū)別和聯(lián)系到底是什么?今天這篇文章,我們一起探討。(注:本文提到的物理機(jī)、虛擬機(jī)和裸金屬機(jī),均指的是公有云場景下的相應(yīng)云服務(wù)器。)

1 物理機(jī)的優(yōu)勢和劣勢

物理機(jī),顧名思義,是把物理的服務(wù)器完全交付給客戶。物理機(jī)唯一的優(yōu)勢在于,所有的資源完全交付給客戶。算力服務(wù)提供商不占用此服務(wù)器的硬件計(jì)算資源。

物理機(jī)的劣勢,主要總結(jié)如下:

    • 管理運(yùn)維難。整個(gè)服務(wù)器系統(tǒng)的運(yùn)行情況完全脫離算力服務(wù)提供商的管理和監(jiān)控,機(jī)器的運(yùn)行情況不可知,也無法完成硬件和系統(tǒng)的管理和運(yùn)維。不支持高可用。如果服務(wù)器出現(xiàn)故障,運(yùn)行于服務(wù)器的業(yè)務(wù)需要停止,這對于需要7x24小時(shí)保持服務(wù)暢通的互聯(lián)網(wǎng)業(yè)務(wù)來說,是不可接受的。不支持資源彈性。系統(tǒng)提供個(gè)資源數(shù)量由服務(wù)器硬件決定,無法更改。比如,服務(wù)器提供50個(gè)CPU核,但客戶場景僅需求1個(gè)CPU核,那么其他49個(gè)CPU核的資源則是浪費(fèi)的,但客戶仍需要為此浪費(fèi)的資源付費(fèi)。

資源利用率低,成本高。沒有資源共享,沒有資源充分利用,資源浪費(fèi)嚴(yán)重。多租戶場景,需要實(shí)現(xiàn)租戶之間的系統(tǒng)隔離;由于整臺服務(wù)器都交付給了客戶,因此隔離工作需要在外部交換機(jī)或其他主機(jī)上實(shí)現(xiàn);額外的資源消耗成本較高,并且安全性較低。

2 虛擬機(jī)的優(yōu)勢和劣勢

虛擬機(jī),是公有云最常見的產(chǎn)品形態(tài),沒有之一。通過虛擬化技術(shù),實(shí)現(xiàn)基于宿主機(jī)(Host)的虛擬機(jī)器,為客戶提供更靈活更低成本的云主機(jī)服務(wù)。大體上,物理機(jī)的劣勢,就是虛擬機(jī)的優(yōu)勢;反過來,物理機(jī)的優(yōu)勢,也即虛擬機(jī)的劣勢。

虛擬(云)機(jī)的優(yōu)勢主要總結(jié)如下:

    主機(jī)可控。虛擬機(jī)在宿主機(jī)側(cè)都有完整的管理監(jiān)控,以及網(wǎng)絡(luò)、存儲等I/O后臺設(shè)備模擬和工作任務(wù)處理。整個(gè)虛擬機(jī)的運(yùn)行情況處于可控狀態(tài),可以實(shí)時(shí)為客戶虛擬機(jī)提供可能的服務(wù),比如硬件出現(xiàn)問題的時(shí)候?qū)崟r(shí)熱遷移。支持高可用。如果服務(wù)器出現(xiàn)故障,運(yùn)行于服務(wù)器的業(yè)務(wù)會(huì)自動(dòng)熱遷移到其他運(yùn)行正常的服務(wù)器,業(yè)務(wù)客戶對服務(wù)器硬件的故障無感。支持資源彈性。客戶云主機(jī),可以支持從1-N個(gè)彈性資源的選擇,并且在主機(jī)創(chuàng)建之后仍可以對主機(jī)資源進(jìn)行擴(kuò)縮容。更低成本。通過虛擬化實(shí)現(xiàn)硬件資源的共享,通過自定義不同資源配比實(shí)現(xiàn)盡可能最高的資源利用率低,從而極致的均攤硬件成本,降低客戶開銷。此外,租戶隔離不需要額外硬件配套,虛擬網(wǎng)絡(luò)交換機(jī)在服務(wù)器本地,不額外消耗其他的硬件資源。

而虛擬機(jī)的劣勢,則主要是性能的問題。虛擬機(jī)性能的額外損耗主要來源于兩點(diǎn):

    虛擬化的損耗。虛擬化分為完全軟件虛擬化、類虛擬化(也稱之為半虛擬化)和完全硬件虛擬化。軟件虛擬化CPU資源消耗較大,類虛擬化次之,完全硬件虛擬化幾乎不需要額外的CPU消耗。目前,主流的CPU芯片都支持CPU處理器和內(nèi)存的完全硬件虛擬化,網(wǎng)絡(luò)和存儲等I/O仍然是CPU軟件虛擬化或類虛擬化。網(wǎng)絡(luò)和存儲兩個(gè)主要I/O的后臺工作任務(wù)的額外資源消耗。

(注:為了簡化問題,這里僅涉及CPU,沒有涉及GPU等業(yè)務(wù)加速處理器,下同。)

3 強(qiáng)強(qiáng)聯(lián)合,物理機(jī)和虛擬機(jī)的優(yōu)勢合并

既然物理機(jī)和虛擬機(jī)都不完美,都存在這樣或那樣的問題。那么,能不能把兩者的優(yōu)勢結(jié)合起來?使得物理機(jī)像虛擬機(jī)一樣功能強(qiáng)大;同樣的,虛擬機(jī)也能像物理機(jī)一樣,沒有額外的資源消耗,實(shí)現(xiàn)裸機(jī)級別的性能。答案是肯定的。

3.1 方案一,物理機(jī)實(shí)現(xiàn)虛擬機(jī)的強(qiáng)大能力,即真正的裸金屬機(jī)

虛擬機(jī)的優(yōu)勢,如資源彈性、高可用等,主要是虛擬化系統(tǒng)提供的。要想物理機(jī)也實(shí)現(xiàn)這樣的能力,則需要物理機(jī)也“支持”虛擬化。虛擬化系統(tǒng)主要分為兩層:宿主機(jī)(Host)側(cè)和客戶機(jī)側(cè)(Guest VM)。通過DPU,可以實(shí)現(xiàn)虛擬化系統(tǒng)宿主機(jī)側(cè)所有任務(wù)的完全卸載。在傳統(tǒng)虛擬機(jī)模式下,這部分工作是在CPU中完成,而在裸金屬機(jī)的模式下,這部分工作卸載到了DPU中,并把性能敏感的任務(wù)進(jìn)行了加速優(yōu)化。

3.2 方案二,虛擬機(jī)實(shí)現(xiàn)物理機(jī)般極致的性能

前面我們分析過,虛擬機(jī)的性能損耗主要來自于非硬件虛擬化的CPU資源消耗,以及網(wǎng)絡(luò)、存儲兩個(gè)主要I/O的后臺工作任務(wù)(網(wǎng)絡(luò)主要是VPC處理,存儲主要存儲虛擬化映射)的CPU資源消耗。

通過DPU,可以實(shí)現(xiàn)整個(gè)宿主機(jī)側(cè)計(jì)算任務(wù)的卸載,這樣就可以實(shí)現(xiàn):

    I/O的完全硬件虛擬化(也可以理解為I/O模擬任務(wù)的卸載)。虛擬出來多個(gè)邏輯的硬件設(shè)備,直通到虛擬機(jī)中。這樣,VM所在的Guest主機(jī),實(shí)現(xiàn)所有計(jì)算機(jī)資源,即CPU處理器、內(nèi)存和I/O設(shè)備,的完全硬件虛擬化(CPU核內(nèi)存的硬件虛擬化由CPU芯片支持,I/O設(shè)備的硬件虛擬化由CPU和DPU共同支持)。實(shí)現(xiàn)完全接近物理裸機(jī)的性能。同時(shí),網(wǎng)絡(luò)和存儲等工作負(fù)載實(shí)現(xiàn)從CPU到DPU的卸載和加速。在CPU中完全沒有了這些“額外”的資源消耗,CPU完全交付給業(yè)務(wù)客戶。

需要注意的是,在此種方案下,在CPU側(cè)仍存在Hypervisor。這個(gè)Hypervisor比較輕量,主要是實(shí)現(xiàn)虛擬機(jī)的創(chuàng)建、銷毀和遷移等操作。Hypervisor幾乎不干擾虛擬機(jī)的穩(wěn)定運(yùn)行,也就幾乎不會(huì)從Guest Mode切換到Host Mode,也就沒有了額外的CPU資源消耗,從而實(shí)現(xiàn)虛擬機(jī)“獨(dú)占”CPU。

4 更進(jìn)一步,虛擬機(jī)和裸金屬機(jī)的統(tǒng)一

既然可以實(shí)現(xiàn)物理機(jī)像虛擬機(jī)一樣功能強(qiáng)大,虛擬機(jī)像物理機(jī)一樣性能極致,那么接下來就會(huì)有一個(gè)新的問題:站在客戶的視角,為什么要區(qū)分虛擬機(jī)和物理機(jī)?兩者不可以統(tǒng)一嗎?答案同樣是肯定的。

系統(tǒng)可以自由的在虛擬機(jī)和裸金屬機(jī)之間切換:

    創(chuàng)建后的虛擬機(jī),如果發(fā)現(xiàn)資源不夠用,就可以在不改變系統(tǒng)環(huán)境的情況下,持續(xù)擴(kuò)容,最終變成裸金屬機(jī)。例如,在一臺具有50核CPU的機(jī)器上,最開始申請了20個(gè)核的虛擬機(jī)。當(dāng)發(fā)現(xiàn)資源不夠用的時(shí)候,可以把此臺主機(jī)擴(kuò)容,擴(kuò)容到30核、40核,知道50核。當(dāng)達(dá)到50核的時(shí)候,就獨(dú)占了此主機(jī),也即從虛擬機(jī)形態(tài)變成了裸金屬形態(tài)。但使用主機(jī)的客戶,對此無感。同樣的,裸金屬的客戶,在發(fā)現(xiàn)此主機(jī)業(yè)務(wù)跑不滿的情況下,可以縮容,變成虛擬機(jī)。用同樣的例子,客戶申請了50個(gè)核的主機(jī),此時(shí)為裸金屬機(jī),客戶縮容到了40核,此刻給客戶呈現(xiàn)的主機(jī)形態(tài)仍然沒有變化。而技術(shù)上的來說,已經(jīng)從裸金屬機(jī)變更成了虛擬機(jī)。

統(tǒng)一虛擬機(jī)和裸金屬機(jī),可以實(shí)現(xiàn)客戶業(yè)務(wù)使用和技術(shù)實(shí)現(xiàn)之間的隔離:從技術(shù)角度,實(shí)現(xiàn)底層實(shí)現(xiàn)和上層呈現(xiàn)之間的隔離,便利客戶使用;l對客戶來說,客戶需要的是一個(gè)性能強(qiáng)勁、功能強(qiáng)大的云主機(jī),用戶不需要關(guān)心到底是物理機(jī)或虛擬機(jī)。

5 總結(jié)

物理機(jī)和虛擬機(jī)是兩套獨(dú)立的體系,獨(dú)立的運(yùn)維,物理機(jī)實(shí)例和虛擬機(jī)實(shí)例之間無法切換。這和我們一直講的算力資源池化是相悖的。

因此,除了優(yōu)化性能和優(yōu)化功能之外,還需要統(tǒng)一平臺,統(tǒng)一資源,簡化運(yùn)維,簡化用戶的使用。這樣,我們可以簡單劃分云主機(jī)發(fā)展的三個(gè)階段:

    第一階段,傳統(tǒng)的物理機(jī)和虛擬機(jī)階段。這個(gè)階段,各自獨(dú)立,物理機(jī)存在高可用等方面的問題,虛擬機(jī)存在性能方面的問題。第二階段,增強(qiáng)優(yōu)化階段。物理機(jī)具備了高可用等傳統(tǒng)虛擬機(jī)所具備的能力,虛擬機(jī)則優(yōu)化了性能,實(shí)現(xiàn)了極致接近硬件實(shí)際的性能。第三階段,物理機(jī)虛擬機(jī)統(tǒng)一形態(tài)階段。給客戶提供統(tǒng)一的云主機(jī)資源,在業(yè)務(wù)層次,不再區(qū)分虛擬機(jī)和物理機(jī)。

五種類型主機(jī)的特性總結(jié),見下面表格。

推薦器件

更多器件
器件型號 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊 ECAD模型 風(fēng)險(xiǎn)等級 參考價(jià)格 更多信息
LAN8742AI-CZ-TR 1 Microchip Technology Inc DATACOM, ETHERNET TRANSCEIVER

ECAD模型

下載ECAD模型
$1.71 查看
BCM53125MKMMLG 1 Broadcom Limited GIGIBIT ETHERNET SWITCH
$135.6 查看
TCAN1042VDRBRQ1 1 Texas Instruments Automotive fault-protected CAN transceiver with I/O level shifting and flexible data-rate 8-SON -55 to 125

ECAD模型

下載ECAD模型
$7.05 查看

相關(guān)推薦

電子產(chǎn)業(yè)圖譜

公眾號:軟硬件融合;CPU靈活性好但性能較差,ASIC性能極致但靈活性差,魚和熊掌如何兼得,同時(shí)兼顧性能和靈活性,我給出的方案是“軟硬件融合”。軟硬件融合不是說要軟硬件緊耦合,相反,是要權(quán)衡在不同層次和粒度解耦之后,再更加充分的協(xié)同。