超大型數據中心運營商以不同于傳統企業的方式而聞名。在大多數情況下,推動他們創新的是其基礎設施的空前規模。在某種程度上,當市場上的解決方案不起作用或者過于昂貴時,它們都達到了一定的規模。
在那個世界里,即使是最簡單,最普通的功能也需要自動化。在Alphabet旗下的谷歌,可以說是世界上第一個超級計算機,其最新的自動化數據中心運營功能之一就是銷毀已失效的硬盤。
與該公司最近自動化的另一項更重要的功能不同——實時調整數據中心的冷卻系統以提高效率,而磁盤銷毀不需要機器學習。谷歌工程師只是簡單地研究了制造工廠中使用的許多現有工業機器人,找到了最合適的工業機器人,并將其用于硬盤驅動器的銷毀。
“這是一個工業機器人,” 谷歌數據中心副總裁卡瓦在接受《數據中心知識》采訪時說。他解釋到,這些機器人與你在汽車廠看到的機器人是相同的。“他們只是高通量。”
退役硬盤可能聽起來很平凡,但它是數據中心運營商最重要的功能之一,尤其是處理全球數十億人、企業和政府敏感數據的運營商。僅僅在磁盤或SSD被丟棄之前清除是不夠的。一個技術高明的黑客有時可以恢復它過去存儲的一些數據。
谷歌首先在2011年詳細介紹了它的流程。該家公司制作的一段視頻顯示,擦拭的驅動器被鋼制活塞刺破,然后被扔進工業粉碎機。這些塑料和金屬碎片被裝箱回收。
如今在公司數據中心被替換的每個驅動器所發生的情況仍然是相同的。不同的是誰在做這件事。卡瓦說,現在由機器人在谷歌所稱的“全自動磁盤擦除環境”中完成。
谷歌數據中心工程師手動將硬盤驅動器扔進碎紙機(來源:谷歌視頻)
自動化不僅可以提高吞吐量,還有助于管理鏈的建立,或者可跟蹤從數據中心到安裝驅動器的那一刻開始處理驅動器的每個人,以及它變成一堆刨花的那一刻。他解釋說,接觸服務器和驅動器的人越少,管理監管鏈越短越容易。
在谷歌數據中心中不存在需要銷毀固定的恒流驅動器。驅動器故障是日常操作的一個正常部分,但它們不會失敗并且需要經常被分割,以至于人工技術人員無法跟上。
此外,該公司只會把“無法核實的東西”徹底清除掉,卡瓦說。(它將可驗證的清潔產品賣給那些給它們第二次生命的公司。)
當機器人真正派上用場時,是在大批量硬件升級期間。“當我們確實需要大吞吐量的時候,我們說好了,我們將去改造整個2TB驅動器的車隊,我們會把它們拿走……我們會讓10tb的驅動器達到標準,或者別的什么。”“這就是機器人非常有用的時候。”
在Google數據中心銷毀硬盤的機器人照片,該公司數據中心副總裁卡瓦在Google Cloud Next 2018的演示中展示(來源:谷歌幻燈片)
今年7月,在舊金山舉行的谷歌Cloud Next會議上,Kava表示,谷歌已經實現了許多與基礎設施相關流程的自動化,但沒有實現大部分日常數據中心的運營。
有些東西,比如庫存管理,供應鏈履行和服務器組裝,非常適合使用機器人技術。這些流程在谷歌中是高度自動化。
該公司還擁有“大量自動化腳本,有助于指導我們數據中心的技術人員,讓他們知道特定服務器的問題,例如,在他們服務之前。”卡瓦說。
至少在今天,機器人不具備取出服務器、斷開電纜等所需的靈活性。他說,也許這在未來可能會發生變化,但今天,絕大多數仍然由人來管理。