提問:如果所有的數據都用打孔卡存起來,那么 Google 的數據中心將有多大?-- James Zetlen
小編先在這里介紹一下「打孔卡」這個老怪物:打孔卡,也叫「穿孔卡」(IBM 卡),利用卡紙上打孔來記錄信息。它看上去就是這個樣子:
這是一枚80列的標準矩形 IBM 打孔卡。
這里牽涉到一段計算機誕生的前史。要說現在計算機的老祖宗,嚴格來講不是教科書上大名鼎鼎的 ENIAC,而是1801年,法國人雅卡爾發明的織布機:
看到它上面一條打孔紙了么,這可是世界上最早的「可編程機器」,這些孔洞記錄了要編制圖案花紋。
后來在1880年代美國,美國用打孔數據機完成了全美人口普查。而制造這些機器的這家公司,就是后來的 IBM。1890年到20世紀初期,這種打孔數據記錄的方式,一直廣泛沿用在商業領域和計算機編程上。(via 維基百科)
幾乎可以肯定的是,Google 擁有比地球上所有其他機構更強大的數據存儲能力。
Google 對于他們的運維細節守口如瓶,所以我也很難確定數據中心的具體的數字。只有少數機構擁有可信的大型數據存儲設施。比如以下幾家特別厲害的:
· NSA(美國國家安全局,最近比較衰)
· NRO(美國國家偵查局,不太出名,管間諜衛星)
· NGA(美國國家地理空間情報局,不太出名)
· CIA(中央情報局,電影里總是出來給主人公搗亂的)
· Schlumberger(斯倫貝謝,石油勘探技術公司)
· Tencent(騰訊,珠寶商)
· Chevron(雪佛龍,石油公司)
我們還要榮譽提名這些:
· Amazon(它們真的很大,但未必有 Google 大)
· Facebook(它們正在變大的道路上,而且速度很快,但還需努力)
· Microsoft(它們有百萬臺以上的服務器(鮑爾默自己說的),但是沒人知道他們要這么多服務器干嘛)
以錢推算
我們先通過錢數,來推算 Google 有多少數據中心。Google 在基建上的開銷——加起來大概超過120億美金。最大的一個數據中心花掉了大概5~10億美金。所以,他們不會擁有超過20個這樣的數據中心。
在 Google 的網頁上提到了它們在以下幾處建造了數據中心:
· 南加州的伯克利郊區
· 愛荷華州的康瑟爾布拉夫斯
· 佐治亞州的亞特蘭大
· 北卡羅來納州的勒諾
· 俄勒岡州的達爾斯
· 中國香港
· 新加坡
· 中國臺灣
· 芬蘭哈米那
· 比利時的圣吉蘭
· 愛爾蘭的都柏林
· 智利的基利庫拉
另外,Google 還控制著其他一些大型數據中心(通過附屬公司)。
· 荷蘭的埃姆斯哈文
· 荷蘭的格羅寧根
· 波蘭的弗羅茨瓦夫
· 弗吉尼亞的雷斯頓
· 還有在佐治亞州亞特蘭大的一些數據中心
· 還有更多遍布世界的上百個小型數據中心。
依耗電量推算
搞明白 Google 有多少數據中心,還可以看看它們的耗電量。不幸的是,我們不能直接去中心看電表的走字。我們只能自己挖點料。
在2010年,Google 透露了他們一年要耗費 258 兆瓦的電力。這能跑多少服務器呢?
我們知道 Google 的數據中心還是很省電的,用在散熱和其他方面的開銷只占總用電量的10%~20%。為了解每臺服務器的耗電量,我們研究一下他們2005年提出的「集裝箱數據中心」的概念。雖然不是很清楚他們具體如何利用這些貨柜——可能現在看來已經有點過時,但可以從中估計出一個合理的數字,答案是每臺215瓦。
由此推算出,他們在2010年大概運行著100萬臺服務器。
基于數據中心的耗電量和開銷,我猜 Google 現在運行著的——或者馬上就要達到的服務器總數,在 180萬~240萬臺左右。
但是「服務器」究竟指什么?Google 可能弄出各種配置的各種奇葩裝備,可能一臺有100核的 CPU,還掛著100個硬盤。我們假設每臺服務器上平均掛著幾個(2~5個)2T 的硬盤,那總共就是 10EB(艾字節 exabytes) 的數據量。
只有 10EB ?
地球上的商用硬盤廠,一年大概造出 8EB 的硬盤。但是這個數字不包括像 Google 這樣的公司,但無論如何,Google 吞掉了一大塊硬盤消耗量。
讓事情聽上去更帶勁一點,就 Google 用掉的這么多硬盤,平均每分鐘就要掛掉一個。但這對 Google 來說,根本就不算什么事兒,在它們這個體量級別的大背景下,Google 的 IT 小哥換硬盤的本事已經爐火純青——不過,我也好奇, Google 程序猿是怎么看待當他們在一臺機器上跑代碼,分分鐘可能碰到硬盤事故的。
磁帶上的 Google
當然,以上只涵蓋了滾燙在線干活的硬盤。誰知道在 Google 的地下室還有多少冷冰冰的磁帶機備份呢?
在2011年一次與 博客 SMB Tech 的作者 Paul Mah 的電話訪談中,來自 Tandbery Data 的 Anderson 透露了 Google 是世界上最大的磁帶機買家,一年要采購 200,000 盤。假設這幾年,它們的采購數量還在增長,所以,還得算上磁帶機的這幾個 EB 才行。
算總賬
我們假設,Google 擁有 15EB,或者 15,000,000,000,000,000,000 字節的數據量(小編:@_@ 我都數不過來了)。
一張打孔卡片可以存儲80個英文字符,然后一箱子打孔卡可以裝上2000片:
“四盒子打孔卡對任何人都夠用了”
15EB 的打孔卡,足夠掩埋我所住的地方:新英格蘭,足足堆上 4.5公里厚。這是上一次冰河世紀冰蓋厚度的3倍多。
看上去很壯觀吧。
然而,這和一些報道中對 NSA 在猶他州的數據中心的離奇描述,還不算什么!
NSA 的數據中心
NSA 正在猶他州蓋一座大數據中心。新聞里宣稱,它們可能造出個 1YB 的怪胎,這實在太尼瑪離譜了!
最近的報道里,新聞編輯們似乎心智恢復正常了一些,又說整個項目可能只有3~12EB 的樣子。并且,我們知道整體耗電量在65兆瓦左右。和 Google 的一個大號數據中心差不多。
還有一些缺少常識的標題黨,毫無根據地吵吵說,NSA 的新機房可能存上「1EB~1YB 之間」的數據……就好比說:「目擊者稱看到一條1毫米~1公里長的蛇。」
再爆一些 Google 的料
挖掘 Google 運維的秘密還有一些技巧。諷刺的是,其中很多要依賴 Google 自己的搜索引擎才行——比如從搜索 Google 又在哪些奇怪的城鄉結合部招人了,到用圖片搜索被手機不小心拍到的數據中心的照片。
然而,找到 Google 秘密數據中心的最妙的技巧也許是一位 Google 前雇員,在 reddit 的「天才小丑吧(talentlessclown)」里爆尿的:
要找到 Google 的秘密數據中心,最好的辦法就是問問出租車司機和披薩快遞小哥。
這件事情確實非常有趣。Google 已經建立了歷史上,地球上最老練的信息搜索匯聚的機器……但知道這些機器所在的人,只有那些的哥和披薩小哥。
螳螂捕蟬,誰在其后?