華盛頓州東部小鎮里巨大的微軟數據中心。
有關微軟云的數字令人驚嘆:一百萬臺服務器及全球超過一百多個網站。我們既然要進入其中的一個數字中心,不妨先看一些統計數據。
1989年:微軟在華盛頓州園區的雷德蒙德啟動第一個數據中心。
200多個:微軟數據中心提供的在線服務個數,全年365天每天24小時無休服務。
150多億美元:微軟建設云基礎架構的投資。
30多萬億:存儲在微軟數據中心里數據對象個數。
1500多萬:微軟旗下網絡平均每秒收到的請求個數。
微軟的光纖網絡數,微軟光纖網絡是北美的大網絡,其長度是地球至月球距離的2倍多。
38億千瓦小時:微軟購買的綠色電力功率,零碳目標的一部分
筆者曾在英國建過和運行過國營ISP,過去數年也負責籌建了三兩個數據中心。和微軟構建和運行的云相比,在下接觸到云自然是微不足道,因此筆者十分期待能一睹微軟云的真面貌。微軟日前組織人參觀數據中心,是十多年來的第一次,筆者收到邀請,當然不會放棄這種好機會。
即便是受邀而至的人,要進入Microsoft數據中心也不容易。9月上旬的一個早晨,我出示了身份證明和簽署幾個表格后,與一小組企業和數據中心記者一起爬入一輛車里。我們花了3小時候乘車前往華盛頓州哥倫比亞河附近的一個小鎮。鎮里有微軟的大型數據中心,當地的低成本水電以及高高在上的沙漠平原穩定氣候適合大型數據中心的運行。
昆西是個不起眼的小鎮,幾十年來一直是東華盛頓州農產業的核心;東華盛頓州自稱是美國馬鈴薯之鄉。不過云計算的崛起改變了小鎮風貌,昆西的電力便宜、吸引力大,將數據中心帶入了沙漠。昆西的寒暑分明,氣候穩定,對數據中心要用到的空調有利,天氣炎熱時只需將空氣經制冷器導入,天氣涼快時的晚上,外部空氣無需制冷即可直接使用。
微軟在昆西建的數據中心不止一個,微軟在昆西建了幾個數據中心,用于展示數據中心各年代的設計。最早期的數據中心不外乎傳統的成品服務器機架,和其他的地理分布型數據中心無異,但昆西站含三種不同的數據中心設計的例子。微軟在昆西的設施共占地270多英畝,遍布沙漠小鎮昆西。
微軟昆西站里的ITPAC設備
昆西最老的數據中心是我們見慣了的現代數據中心,服務器之間冷熱通道交錯,而在不同的房間里可以看到不同版本的服務器硬件。從這里可以看到一個非常有趣的現象,隨著硬件變得更強大、更密集,機架數目卻越來越少,這樣做是為了確保服務器大廳的功耗不超過設計預算。數據中心的發展后來進入基于開放計算的系統,可以說是在原來的一級供應商硬件基礎上的一個飛躍。二者雖然可以共用一個大廳,但是基于開放計算的系統用的機架要少得多。
微軟期間向虛擬化基礎架構轉型,用了軟件定義網絡和虛擬設備處理交換和其他網絡功能,硬件數量進一步減少。在數據中心見不到許多見慣了的網絡硬件還真有一種奇怪的感覺,但時下越來越多的設施都采用這種設計,機架層次上的網絡用虛擬設備進行處理。
邁出標志著上幾代數據中心的大廳后,我們來到微軟目前數據中心構建版的樣板前。新一代設施均為容器化設備,有些置于裝有通風裝置的大棚內,有些置于戶外的混凝土墊上。容器由知名硬件供應商構建,容器在微軟目前諸如運行Azure之類的云服務里占有核心地位。這些容器的設計目標是只需電力、網絡和少量的水,它們是現代云的基石,我們用到的計算和存儲都拜它們所賜。
擋雪板確保嚴冬里通往ITPAC的道路暢通無阻
昆西的容器化數據中心模塊展示了微軟稱之為ITPAC的數據中心在不同階段(及供應商)的發展過程。最初的ITPAC放置在一個大型、只有頂的建筑里,高度為兩個容器。這些建筑一開始并無墻壁,但ITPAC遷入后不久,工作人員時時需在雪堆里穿梭,就裝上了擋雪板。后來,ITPAC就部署在戶外的混凝土墊上。
原始的ITPAC設計是基于容器化硬件,曾在微軟芝加哥站運行過,我們并未見到它的樣本。ITPAC的重要性不在于它包含什么,而在于它的設計理念。其時微軟最關注的是幾個參數規格:功率、計算、存儲、網絡接入點、電力供給及冷卻。除此之外,其他一切都都交給了供應商,甚至包括容器設計。各ITPAC之間的區別表明了這一點,有些是基于傳統運輸集裝箱,有些更類似于旅行房車。
在ITPAC里穿行,有點像是在現代數據中心的熱通道或冷通道漫步。在這里見不到什么令人驚訝的東西,畢竟,大規模交付云的關鍵是要減少與運行數據中心相關的風險,因此,大多數硬件都是見慣了的服務器,讓人能聯想到網絡設備的東西寥寥無幾。
戶外的ITPAC,上方無頂,唯見云
微軟正在大規模擴建昆西站,新的超規模數據中心正在興建中。新的超規模數據中心由四個建筑組成,各自擁有獨立的設備,該數據中心是筆者見過的最大的中心之一。由于尚在建設之中,只有一座建筑完成了裝修,出于安全上的考慮,我們未獲準進入。不過,坐在車上轉一圈也能感覺到它的碩大:堪比747飛機的機庫。
在這四座建筑下,微軟的數據中心策略正朝著全新方向發展。微軟不會再從第三方供應商購買ITPAC和服務器。微軟現在用OEM構建自己的開放計算項目硬件。如此,微軟可以構建高密度的機架,這些機架將在軟件定義平臺上支撐起新一代云服務。而軟件定義平臺則可以根據需要利用Windows服務器和Azure中內置的軟件定義數據中心工具重新配置。
我們沒有進去,但微軟提供了旗下新數據中心里開放計算硬件的照片。
新數據中心的設計壽命比以前的數據中心壽命更長。等到新的昆西站壽終正寢時,其間必然要經歷幾代硬件的發展,還會加入計算和存儲,同時它用到的電力預算卻保持不變。基于此原因,微軟重用回服務器機架法,而并非用時下的容器化設計,這樣做在更換服務器和安裝新硬件時會更容易一些。
但這并非微軟數據中心發展的終結:微軟嘗試過交付云的各種新方式,例如,微軟最近進行了水下數據中心的測試。在前進的道路上,微軟將打造和推出更多新一代的數據中心,將在這片荒漠上擴建更大規模的、裝滿計算、網絡和存儲的設施。
微軟對環境影響表現了強烈的關注,旗下所有數據中心均為零碳型(昆西站的運行靠的是附近哥倫比亞河的水電系統)。而且,微軟還回收所有舊的服務器,但磁盤永遠不會離開昆西站,至少不會是整塊的。我們去參觀了微軟用的磁盤粉碎機,超大的設備,瞬間就將一個硬盤驅動器變成面目全非的一堆金屬:砸、壓、扭、攪。貌似非常徹底的數據安全法!
微軟在旗下數據中心所為都是商業上敏感的東西,微軟能通過開放計算項目共享是件喜人之事。四個最大的云供應商里三個加入了OCP(開放計算計劃),他們都在共享關于云服務器、存儲和網絡方面的設計和經驗,并為我們提供未來云發展的各種線索。
微軟最近在開放計算項目里共享了關于一種新的UPS方法,做法是將電池與PSU置入服務器本體內。如此可在數據中心里為服務器騰出更多空間,在電源故障的情況下用到的電池室不會占地方。內置電池可以相對較小些,它們只需要在站里的大型發電機啟動時保持服務器正常運行。
筆者對微軟昆西站的最終印象是什么呢?假若我說它是令人嘆為觀止的凡間之物,我并不是在指責微軟。這樣的說法其實是贊語。
超大規模云需要的就是平凡、簡單、甚至凡俗。超大規模云必須全年365天、每天24小時運作,幾十年如一日。即是說它必須可靠,巨大的房間里沒別的東西發生,只有服務器風扇的轉動、LED的閃爍。如果它成了別的東西,那它就不是一眾企業和蕓蕓眾生依賴的云了。如果它成了別的東西,那就意味著微軟的失敗。
我上面說“令人嘆為觀止的凡間之物”。是的,還真概括得不錯。