加入星計劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴散
  • 作品版權(quán)保護
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

原子鐘在數(shù)據(jù)中心的作用:原子從對數(shù)據(jù)造成不利影響到帶來各種益處的轉(zhuǎn)變過程

2023/03/13
1738
閱讀需 19 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

利用原子鐘授時現(xiàn)已成為數(shù)據(jù)中心不可或缺的組成部分。目前,通過全球定位系統(tǒng)(GPS)和其他全球?qū)Ш叫l(wèi)星系統(tǒng)(GNSS)網(wǎng)絡(luò)傳輸?shù)脑隅姇r間已使全球各地的服務(wù)器實現(xiàn)了同步,并且部署在各個數(shù)據(jù)中心的原子鐘可在傳輸時間不可用時保持同步。

無論是由于系統(tǒng)需求還是合規(guī)性,這種出色的同步性能都至關(guān)重要,可確保每年在全球范圍內(nèi)收集的數(shù)據(jù)(以澤字節(jié)為單位)能夠得到有效存儲并用于許多應(yīng)用。原子的量子性質(zhì)可保持精確的時間,是確保未來能夠以更快的速度處理更多數(shù)據(jù)的關(guān)鍵所在,而具有諷刺意味的是,就在幾年前,原子的量子性質(zhì)還被視為提升數(shù)據(jù)處理能力和速度的最大阻礙。

1965年,Gordon Moore預(yù)測集成電路上的晶體管數(shù)量每年翻一番。這一數(shù)字最終被修改為每兩年翻一番。隨著晶體管密度的增加,速度有了顯著提升,成本和功耗也不斷下降。

在1965年,人們可能很難想象,2021年時在一個半導(dǎo)體上布置500億個晶體管是一種現(xiàn)實需求,但正如半導(dǎo)體技術(shù)隨著時代不斷發(fā)展,應(yīng)用需求也在不斷變化。手機、金融交易和DNA圖繪制等應(yīng)用都非常依賴單片機每秒可執(zhí)行的運算次數(shù),而這一數(shù)字與芯片上的晶體管數(shù)量密切相關(guān)。

圖1. 極具諷刺意味的圖片:工程師試圖遵循摩爾定律

摩爾定律的消亡

遺憾的是,由于物理學(xué)限制,摩爾定律正在迅速走向終結(jié)。隨著晶圓生產(chǎn)工藝節(jié)點現(xiàn)已達到10納米以下,晶體管的大小僅為硅原子的10到50倍左右。在這個尺度上,原子和自由電子的大小以及量子特性顯著阻礙了晶體管大小的進一步縮減。從本質(zhì)上講,可以將原子視作推翻這一定律的最終原因。

盡管摩爾定律終將消亡,但是,對提高處理能力的需求卻不斷增加。隨著物聯(lián)網(wǎng)(IoT)、信息流服務(wù)、社交媒體帖文和自動駕駛汽車的出現(xiàn),每天產(chǎn)生的數(shù)據(jù)量會繼續(xù)呈指數(shù)增長。

據(jù)估計,2021年每天產(chǎn)生的數(shù)據(jù)量為2.5艾字節(jié)(2,882,303,761,517,120,000字節(jié))。當前使用的艾字節(jié)數(shù)據(jù)庫每秒可處理超過10萬個事務(wù)(一個事務(wù)包含許多次運算),而在可預(yù)見的將來,數(shù)據(jù)庫的規(guī)模和每秒處理的事務(wù)數(shù)將持續(xù)增長。

同步機器

數(shù)據(jù)量的這種爆炸式增長,再加上數(shù)據(jù)必須達到的寫入、讀取、復(fù)制、分析、操作和備份速度,這些因素要求數(shù)據(jù)中心架構(gòu)師找到一種能夠繞過摩爾定律終結(jié)的方法。對于采用分布式數(shù)據(jù)庫的數(shù)據(jù)中心,架構(gòu)師采用了水平擴展方法,即將數(shù)據(jù)庫分布在一個集群中的多個服務(wù)器上,而不是整個數(shù)據(jù)庫駐留在一個服務(wù)器上。

在這種配置下,集群本質(zhì)上用作一臺巨型機器,因此系統(tǒng)的大小和速度現(xiàn)在受到數(shù)據(jù)中心的外形尺寸而非原子大小的限制(接招吧,原子?。?。

軟件工程師現(xiàn)在的職業(yè)是編寫能夠?qū)崿F(xiàn)水平擴展的代碼。但是,要使各種軟件都正常工作,所有機器都必須同步,否則會違反因果關(guān)系的概念。

什么是因果關(guān)系?舉個最簡單的示例。假設(shè)您用兩臺攝像機來記錄100米短跑的圖像,每臺攝像機都有自己的內(nèi)部時鐘。第一臺攝像機位于起跑器上。第二臺攝像機位于終點線上。兩個傳感器都在進行連續(xù)拍攝,并用各自時鐘的時間給每個圖像添加時間戳。

要確定比賽中獲勝的短跑選手的正式成績,將檢查第一臺攝像機的圖像以了解第一位選手離開起跑器時的時間點,然后用終點線上的攝像機圖像上該選手沖過終點線時的時間減去該時間戳。

要實現(xiàn)此目的,兩臺攝像機的同步精度必須都達到可接受的偏差水平。如果時鐘的同步精度只有±0.05秒,那么便無法確定成績?yōu)?.6秒的選手是否確實打破了9.58秒的世界紀錄。如果它們與體育場時鐘的同步精度只有±5秒怎么辦?

想象一下這樣的場景:從體育場的主時鐘觀察,一場比賽正好在下午12:00:00:00開始。第一位選手在下午12:00:09:60時沖過終點線。從體育場主時鐘的角度來看,正式比賽成績是9.6秒。

但是,如果第一臺攝像機的時鐘正好快5秒,而第二臺攝像機的時鐘正好慢5秒呢?比賽將在下午12:00:05:00正式開始,在下午12:00:04:60結(jié)束。比賽將在開始前0.4秒正式結(jié)束,這會打破世界紀錄并推翻物理定律,目前的紀錄保持者很有可能會不公正地遭到所有贊助商的棄用。

圖2. 時鐘偏差會導(dǎo)致因果關(guān)系問題。在這種情況下,比賽在開始前就正式結(jié)束了。

將因果關(guān)系應(yīng)用于數(shù)據(jù)庫

同樣的因果關(guān)系原則在數(shù)據(jù)庫中也十分重要。事務(wù)記錄更新必須按照它們發(fā)生的順序出現(xiàn)在數(shù)據(jù)庫中。如果您期望在通過直接取款支付每月房貸之前直接存入自己的工資,而銀行的數(shù)據(jù)庫沒有按正確的順序記錄這些事務(wù),那么您可能會被收取透支費。在一臺機器上,因果關(guān)系錯誤很容易防止,但在多個服務(wù)器上,每個服務(wù)器都有自己的內(nèi)部時鐘,服務(wù)器必須同步并為每個事務(wù)加上時間戳。

要實現(xiàn)此目的,必須有一個服務(wù)器充當參考時鐘,就像體育場的時鐘,它必須采用最大程度減小每個服務(wù)器時鐘的時間誤差的方式,將時間分配給每個服務(wù)器。每個時間戳的偏差(比賽中為±5秒)形成一個時間包絡(luò),其長度為時鐘偏差的兩倍(比賽中為10秒)。對于分布式數(shù)據(jù)庫,一秒內(nèi)可以容納的非重疊時間包絡(luò)數(shù)量應(yīng)當至少與系統(tǒng)預(yù)期的每秒事務(wù)數(shù)量大致相同。

概率、因果關(guān)系的關(guān)鍵性和實現(xiàn)成本最后都會在最終解決方案中發(fā)揮作用,但這種關(guān)系是一個很好的起點。時間戳偏差為±1毫秒的系統(tǒng)將具有2毫秒的時間包絡(luò),一秒內(nèi)最多可容納500個非重疊時間包絡(luò)。此系統(tǒng)可以支持每秒執(zhí)行約500個事務(wù)。

NTP和PTP的不足

以太網(wǎng)授時技術(shù)也稱為網(wǎng)絡(luò)時間協(xié)議(NTP)和精確時間協(xié)議(PTP),用于同步數(shù)據(jù)中心的分布式數(shù)據(jù)庫中的所有服務(wù)器。這些協(xié)議可以確保局域網(wǎng)能夠以亞毫秒(NTP)或亞微秒(PTP)的偏差來分配時間,從而支持每秒執(zhí)行數(shù)千(NTP)或數(shù)百萬(PTP)個事務(wù)。

遺憾的是,即使憑借這些解決方案可以繞過原子帶來的摩爾定律消亡,物理學(xué)仍以光速的形式在分布式數(shù)據(jù)庫的道路上設(shè)置了另一個障礙。

試想一下,一個使用PTP進行準確同步的分布式數(shù)據(jù)庫在加州圣何塞運行,每秒可輕松執(zhí)行100,000個事務(wù),且不會產(chǎn)生任何因果關(guān)系問題。一位數(shù)據(jù)庫架構(gòu)師正坐在自己位于紐約的辦公室里,他的老板要求他更新大量記錄。

這名架構(gòu)師希望能夠充分利用其新數(shù)據(jù)庫并展示系統(tǒng)的能力。他計劃每秒執(zhí)行100,000個事務(wù)。

為了根據(jù)請求更新記錄,他創(chuàng)建了一個簡單的事務(wù),即僅當?shù)谝粋€記錄的值大于第二個記錄時,才會將第一個記錄的值與第二個記錄相加。如要達到這一目的,他必須對這兩個記錄發(fā)出讀取請求。然后,他在紐約的本地機器對這些值進行比較,然后在需要時向第二個記錄發(fā)送寫命令。

完成此操作后,他想要接著執(zhí)行下一個事務(wù),即將第三個值與新的總和進行比較。如果新的總和大于第三個記錄,那么將使用第三個記錄替換總和。他想對600萬條記錄重復(fù)此操作。由于數(shù)據(jù)庫每秒能夠處理100,000個事務(wù),他認為此任務(wù)將在大約一分鐘內(nèi)完成。他告訴老板,他將在五分鐘內(nèi)更新記錄,然后離開去喝杯咖啡。

喝咖啡的時候,他讀到一個故事,內(nèi)容是新的百米短跑成績是負0.4秒,這違背了物理定律,并且之前的紀錄保持者因為失去了所有的代言費正在起訴體育場負責人。架構(gòu)師自顧自地笑了起來,認為體育場應(yīng)該聘請他作為同步專家。

五分鐘后他回到辦公桌前,沮喪地發(fā)現(xiàn)他的數(shù)據(jù)庫更新只完成了不到1,500個事務(wù)。他難過地意識到自己的錯誤,并準備將自己的簡歷發(fā)給那個體育場,他希望他的PTP部署不會出現(xiàn)同樣的問題。

問題出在哪里?光速將紐約和圣何塞之間理論上最快的數(shù)據(jù)傳輸速度限制在13.7毫秒。

圖3. 光速對兩點之間的數(shù)據(jù)傳輸速度施加了理論上的限制

距離問題

遺憾的是,現(xiàn)實世界的事務(wù)處理速度甚至更慢。即使兩個地點之間有專用的光纖鏈路,光纖的折射率、光纖的實際路徑和其他系統(tǒng)問題也會延長傳輸時間。因此,僅僅從紐約傳輸一次,就需要40到50毫秒的時間才能到達圣何塞。

但是,此事務(wù)中有四個獨特的操作。有兩個可以同時發(fā)生的讀操作,隨后必須將它們發(fā)送回紐約。往返過程需要80到100毫秒。然后,在對兩個值進行比較后,就會發(fā)出寫操作,并且必須發(fā)回寫確認以指示寫操作已完成,然后才能開始下一個事務(wù)。

突然之間,數(shù)據(jù)庫每秒能否執(zhí)行100,000個事務(wù)已無關(guān)緊要,因為距離將系統(tǒng)每秒的處理能力限制為不超過5個事務(wù)。要完成600萬個事務(wù),此系統(tǒng)需要13天的時間,這樣便有足夠的時間再喝幾杯咖啡,甚至更新一份簡歷。這種延遲稱為通信延遲。

規(guī)避延遲

但就像摩爾定律一樣,數(shù)據(jù)庫架構(gòu)師想出了規(guī)避延遲的方法。在用戶附近創(chuàng)建數(shù)據(jù)庫副本,這樣他們便可隨意使用數(shù)據(jù),而不必將信號發(fā)送到全國各地。

定期比較和協(xié)調(diào)復(fù)制以確保一致性。在協(xié)調(diào)過程中,事務(wù)時間戳用于確定事務(wù)的實際順序,并且當存在不可協(xié)調(diào)的差異時(例如事務(wù)時間包絡(luò)重疊時),有時會回滾記錄。減少時鐘偏差可以減少復(fù)制的實例中不可協(xié)調(diào)的差異數(shù)量,因為時間包絡(luò)增多會減少重疊的概率。這可提高效率并降低數(shù)據(jù)損壞概率。

但現(xiàn)在,時間戳不僅在每個數(shù)據(jù)中心內(nèi)部必須做到精確,在不同的數(shù)據(jù)中心之間也必須精確,這些數(shù)據(jù)中心可能相隔數(shù)千英里,并通過云相互連接。由于需要一個偏差極低且在兩個地點均可隨時獲得的外部參考,因此這項任務(wù)變得愈加困難。

下至原子級別

此時,數(shù)據(jù)庫架構(gòu)師以前的敵人“原子”登場。當原子忙于廢除摩爾定律時,其亞原子粒子卻在忙于自旋。原子核內(nèi)的中子和質(zhì)子一直在旋轉(zhuǎn),而與此同時電子則一邊忙于圍繞原子核公轉(zhuǎn),一邊自旋。這類似于地球在繞太陽公轉(zhuǎn)的同時自轉(zhuǎn)。

電子可以圍繞自身的軸順時針或逆時針自旋。考慮到人體內(nèi)約有7*10^27(7后面有27個零)個原子,所有亞原子粒子都在我們體內(nèi)自旋,令人驚訝的是我們并沒有一直頭暈?zāi)垦?。(注:亞原子粒子并不是真的在忙著自旋和公轉(zhuǎn),它們實際上是在忙著給我們提供概率波函數(shù)和磁相互作用,這會讓我們獲得類似于它們進行自旋和公轉(zhuǎn)時的結(jié)果。但是,如果想到所有的自旋會讓您頭暈?zāi)垦#敲丛噲D理解量子物理學(xué)的現(xiàn)實肯定會更令人厭惡。)

圖4. 具有核和價電子的概念性原子,具有核自旋、電子自旋和軌道自旋

如果電子吸收特定精確頻率的微波輻射,繞電子軸的自旋方向會改變。如果地球上發(fā)生這種情況,太陽會突然從東方落下,從西方升起!

原子鐘這種機器專門用于檢測電子自旋狀態(tài),然后通過微波輻射改變方向。頻率變化取決于元素、同位素和電子的激發(fā)態(tài)。

在機器確定頻率(即所謂的超精細躍遷頻率)后,便可將周期確定為頻率的倒數(shù),這樣便可計算周期數(shù)來確定經(jīng)過的時間。國際上對秒的定義是誘導(dǎo)銫原子軌道外層內(nèi)電子的超精細躍遷所需的9,192,631,770個輻射周期。

原子鐘是世界上最穩(wěn)定的商用時鐘。一副紙牌大小的原子鐘稱為芯片級原子鐘(CSAC),其24小時內(nèi)的漂移為百萬分之一秒,而冰箱大小的原子鐘稱為氫微波激射器,其24小時內(nèi)的漂移僅為十萬億分之一秒。巧合的是,十萬億分之一也大約是氫原子半徑與百米短跑選手和現(xiàn)已失業(yè)的紐約數(shù)據(jù)中心架構(gòu)師身高的比值。

憑借這些原子鐘提供的精度,可以為在東京、倫敦、紐約、廷巴克圖或世界其他任何地方的數(shù)據(jù)中心運行的分布式數(shù)據(jù)庫提供大約50萬到500億個非重疊時間包絡(luò)。

圖5. 單位“秒”是通過計算銫超精細透射輻射頻率的9,192,631,770個周期來定義的

時間的分配

時間如何從這些原子鐘到達所有數(shù)據(jù)中心?協(xié)調(diào)世界時(UTC)是通過衛(wèi)星、光纖網(wǎng)絡(luò)甚至互聯(lián)網(wǎng)分配的全球時間。UTC本身源自位于世界各地的國家實驗室和授時站的一系列高精度原子鐘。UTC的提供組織會收到一份報告,其中載明了源自這些時鐘的UTC時間以及它們各自與計算出的UTC的偏移量。然后,這些實驗室和其他設(shè)施將時間傳送到世界各地。

UTC報告每月公布一次,告訴這些國家實驗室他們在上一個月與UTC的微小時間偏移量。從技術(shù)上講,直到事發(fā)一個月后,我們才知道準確的時間偏差。更糟糕的是,由于地球自轉(zhuǎn)和我們與可觀測恒星的相對位置的變化,UTC會定期增加額外的秒數(shù),即躍遷秒。雖然這可使地球與宇宙保持一致,但它會引起數(shù)據(jù)中心和100米短跑成績的混亂。

圖6. 氫微波激射器中產(chǎn)生的超精細躍遷頻率為1.420405751 GHz,將導(dǎo)致電子自旋反轉(zhuǎn)

GNSS登場

數(shù)據(jù)中心用來獲取UTC的常用方法有兩種:通過互聯(lián)網(wǎng)使用公開的NTP時間服務(wù)器,以及通過衛(wèi)星使用GPS或GNSS網(wǎng)絡(luò)。雖然在分布式數(shù)據(jù)庫的早期部署期間,通過互聯(lián)網(wǎng)上的公共NTP時間服務(wù)器進行授時很常見,但固有的性能、可追溯性和安全問題已經(jīng)促使人們放棄了這種解決方案。

盡管GPS和其他GNSS通常被視為定位和導(dǎo)航系統(tǒng),但它們實際上是精確授時系統(tǒng)。接收器的位置和時間取決于信號以光速從多個衛(wèi)星傳輸到接收器的傳輸時間。極具諷刺意味的是,這是物理學(xué)原理引發(fā)問題的又一個案例(此案例中是光速而不是原子),但也有助于解決問題。

這些衛(wèi)星有自己的機載原子鐘,這些原子鐘與從地面站傳輸?shù)叫l(wèi)星的UTC同步。利用這種方法獲取UTC可以提供5納秒范圍內(nèi)的時間偏差,從而實現(xiàn)每秒1億個時間包絡(luò)。

這種方法比公共NTP服務(wù)器更可靠、更精確,雖然這些信號可能會被太陽風暴或蓄意的信號干擾等事件中斷,但在出現(xiàn)這些信號時,可以在每個單獨的數(shù)據(jù)中心放置與衛(wèi)星信號同步的備份時鐘,以便在中斷期間提供所需的偏差水平。

圖7. 數(shù)據(jù)庫事務(wù)速率的發(fā)展歷程以及實現(xiàn)和禁用的技術(shù)

下一步:躍遷電子

隨著未來對獲取、存儲和處理數(shù)據(jù)的需求不斷增加,我們需要具有極低偏差的新型原子鐘技術(shù)和時間傳輸系統(tǒng)。目前,國家授時實驗室正在開發(fā)一種新型原子鐘,用于研究電子躍過軌道層時發(fā)生的光學(xué)躍遷。這些原子鐘的頻率穩(wěn)定性可達到萬億分之一赫茲,最終將用于重新定義秒這個單位。

通過專用光纖鏈路或機載激光器實現(xiàn)的信號傳輸已經(jīng)顯著提高了傳輸精度。憑借這些不斷涌現(xiàn)的創(chuàng)新數(shù)據(jù),原子和光將繼續(xù)它們之間復(fù)雜的愛恨交織關(guān)系,從而能夠以更快速度處理越來越多的數(shù)據(jù),而不會出現(xiàn)一致性或因果關(guān)系問題。

相關(guān)推薦

電子產(chǎn)業(yè)圖譜