提到數(shù)據中心,你想到的是怎樣的場景?
若干個房間內排布著一排又一排的服務器,交錯的電線可能埋在了地板下方,機房永遠開著冷氣,每一臺服務器上都閃著綠瑩瑩或者藍幽幽的光,顯示一切正常。
還是更酷炫一點,如同《碟中諜》5的場景中,把數(shù)據存儲放在水下?
立體的數(shù)據中心
在曙光看來,綠色節(jié)能與智能化將是成熟數(shù)據中心的“標配”,未來數(shù)據中心都將圍繞這兩個方向來優(yōu)化。
曙光服務器產品事業(yè)部總經理秦曉寧在2016年中科曙光創(chuàng)新技術全國巡展上海站上介紹了其液冷服務器,并描繪了未來數(shù)據中心可能的場景。
模塊化的部署,鋼結構的組成,標準化的設計,一切都將非常簡單。這些可以在工廠預制,到現(xiàn)場直接組裝,施工基本上2~4個月就可以建設完成。作為一個三維立體的結構,可以減少整個占地面積,未來擴展起來也非常方便。
后續(xù)擴容時可以像搭積木一樣,從一個可以擴展到幾個,并被稱為積木式擴容的數(shù)據中心。根據不同的業(yè)務需求,每個數(shù)據中心都是模塊化的設計,非常容易復制,可以按照需要擴容。
而這些的實現(xiàn)都離不開液冷技術。所謂液冷,是通過某種液體,比如水、氟化液或是某種特殊的不導電的油,來替代空氣,把器件運行時所產生的熱量帶走。一種是間接的冷板方式,即器件本身不直接接觸液體,而是先把熱量傳輸給裝有液體的銅制冷板,再通過液體循環(huán)帶出設備,另一種是直接的浸沒方式。曙光推出了TC4600E-LP液冷型服務器的散熱是風冷和液冷的混合方案,CPU、GPU/MIC采用液冷冷板散熱,其余部件采用風冷散熱。
“這個數(shù)據中心最大好處是省錢,基本上把現(xiàn)在所有最重要的投資這一塊就省掉了,不用再蓋一棟特別漂亮的大樓,這個樓的基礎基建投入非常大,而且在這個數(shù)據中心里面不用為了它的制冷去買各種各樣的室內室外的機組、空調等等,這些東西都省掉了。” 秦曉寧說。
不僅如此,立體數(shù)據中心可以更加智能化,只要設計好幾個坐標,X、Y、Z軸,所有的設備都可以不用人去交互,所有設備不用人去安裝,全部按照既定方案,由機械手臂定位、安裝到位,可以降低部署時間,即使是后續(xù)的維護,只要監(jiān)控管理做得好,哪塊硬盤壞了、電源壞了,直接可用機械手臂去更換。
完全通過機器人智能的24小時巡檢就可以提高運維效率,不需要人員值守。人只需要管理機器手臂,這將大大減輕了數(shù)據中心運維管理人員的工作量。
此外,這也意味著硬件重構、軟件定義。以前需要買服務器、買存儲、買網絡,再把它結合起來做一套機房應用,以后將是集成的系統(tǒng),很多設備已經不分存儲、計算還是網絡了,都是一體機。
迎接E級計算
關于未來數(shù)據中心的設想,歸根到底是為了迎接下一代超級計算機的使用。而目前最有名的超級計算機當屬不久前憑借每秒9.3億億次的浮點運算速度勝出的“神威太湖之光”,它不僅速度比第二名“天河二號”快出近兩倍,其效率也提高3倍,成為了新一期全球超級計算機的“狀元”。
在計算從P級(1015Flops) 向E級(1018Flops)發(fā)展的階段,世界各國都把E級計算作為下一個爭奪的高地。但是伴隨而來的還有相應的技術問題:訪存墻問題仍然是提升計算速度的第一大難題,處理器的處理速度和訪問速度之間的不匹配,隨著超級計算的規(guī)模不斷增加,互聯(lián)網絡對計算性能的影響越來越大,E級計算對互聯(lián)網絡提出了更高的要求,其可靠、能耗都會帶來一系列的問題。
數(shù)據中心建設正是重點部署的方面。針對傳統(tǒng)數(shù)據中心建設規(guī)劃周期長、建設成本高、運維復雜、系統(tǒng)利用效率低、數(shù)據聚合性差等問題,中科曙光推出的立體化數(shù)據中心兼有模塊化、綠色化、智能化、分離融合、高密度等特點,可為未來的數(shù)據中心建設提供一整套IT系統(tǒng)解決方案,滿足E級計算對數(shù)據中心的需求。
曙光公司副總裁沙超群表示,針對E級計算可能帶來的眾多難題,中科曙光將憑借體系結構創(chuàng)新,從計算、存儲、網絡、系統(tǒng)軟件、系統(tǒng)冷卻和可靠性等多方面有針對性地迎接E級計算帶來的挑戰(zhàn)。
“能耗是下一代數(shù)據中心需要去優(yōu)化的必選項。”秦曉寧說,“作為數(shù)據中心顛覆式創(chuàng)新技術之一,數(shù)據中心綠色化將成為趨勢,通過液冷技術、設備的自動休眠、動態(tài)能耗等技術,讓能耗用到真正給用戶提供價值的計算和數(shù)據當中去。”
“目前絕大多數(shù)數(shù)據中心監(jiān)控系統(tǒng)只有監(jiān)沒有控,只能提供相應的數(shù)據采集、數(shù)據的分析反饋,而不能形成一個完整的閉環(huán),來智能地調節(jié)、監(jiān)控、控制基礎設施設備,這也是未來數(shù)據中心必將去優(yōu)化和解決的。”秦曉寧說。
“作為研制E級高性能計算系統(tǒng)的原型機,在完成E級系統(tǒng)關鍵技術驗證的同時,更要使系統(tǒng)具有良好的生態(tài)環(huán)境和廣泛應用適用性。”曙光高性能產品事業(yè)部總經理曹振南補充道,“而大規(guī)模數(shù)據中心的計算處理能力將是其中重要一環(huán)。”
也許某一天,破案可能更加高效。警官通過串并案就可以綜合對比嫌疑人的行蹤、通話記錄和車輛定位等信息,鎖定嫌疑人的時間將大大縮短。這樣的應用場景離不開大數(shù)據平臺的業(yè)務應用,基于分布式的計算和分布式大數(shù)據的集群來實現(xiàn)上層的業(yè)務支撐。
“很多客戶已經意識到任何一個廠商或者集成商,建設一個相對規(guī)模的云計算平臺是非常快的,像搭積木一樣。那么更大的任務是搭建完這個平臺以后,現(xiàn)在的業(yè)務怎么跟這個平臺進行融合,簡單來說就是我的業(yè)務如何遷到這個平臺上。”曙光解決方案中心副總史經業(yè)說。現(xiàn)在,客戶更多地關心資源如何整合,現(xiàn)有分布在各個點目的分散的資源怎么進行邏輯的集中,怎么進行資源的調度,怎么進行非常輕量級的運維以降低運維成本和團隊運維能力。
這這些都離不開高性能的計算,更離不開為之服務的數(shù)據中心建設。