民眾有無權利知道每個光輝的云計算產業數字背后需要多少血汗錢來支撐?投資云計算需要承擔多大的風險?誰將為這些風險來負責?而這些,恰恰是我在各地云計算發展藍圖中所未見,希望在下一張“云”圖上能夠看見
【尚吉剛/文】沖動是魔鬼。近期全國各省市云起云涌,陸續宣布的云戰略和云計劃,讓人不禁想起這句古老的警示。其中重慶市的目標更是驚人:重慶設計待建的超級計算機,性能將是目前T0P500第一名 “K”超級計算機的十倍。在興奮之后,我們應該去思考,我們是否陷入了一個由云技術和GDP共同刺激和粉飾的數字陷阱?
各省市陸續發布的云計算宏偉藍圖,將云計算中心或者超級計算中心的建設放在了突出的位置上。我對計算的發展和進步一直持熱烈的支持態度,但因為工作關系能了解到一些數據中心的真實運行狀態,所以我對各地政府主導的云計算和超級計算的建設規模和狂熱程度捏把冷汗。
首先,齊上、大上云基地和計算中心是本輪發展的一個重要特征,且基本不分地域和基礎,大有全面開花的趨勢。但需要我們正視的是,能源供應和地理位置計算中心選址原則的大問題。
超級計算機往往是耗能大戶,就拿日本“K”超級計算機而言,它的功率達到了12660千瓦,這實際上是個極其龐大的數字。如果性能提升10倍,即便工藝和技術成熟度可以抵消掉一些能耗的增加,但總體算下來總功率負荷仍有可能超過50000千瓦、甚至接近100000千瓦。按照新增1千瓦時新增發電、送電設備需要5000元左右的粗算成本,建設一個超級計算中心所需的新增電能負荷也是個驚人的數字,如果常年開機運行,其消耗的電力和龐大的電費也同樣是巨大的經濟負擔。若常年閑置,其硬件折價帶來的資產損失同樣是極其巨大的。
谷歌為了給數據中心散熱,特地選在了一個水源地旁邊建設數據中心,云計算中心的選址不單要考慮電力供應,還需要考慮當地的水資源、年度平均氣溫等環境指標,因為每一個要素都可能對后續成本造成巨大的影響。
現在多數的大城市都面臨缺電缺水的局面,而新增發電容量在環保口徑越來越嚴格的前提下,我們也不能做太高的期待。所以,發展云計算基地和超算中心,地理要素是不得不面對的。發展云計算產業,靠三天兩頭地拉閘限電解決不了問題,能源問題就如同地利,這就決定了云計算不應該也不可能在各地都開花結果。
其次,中國云計算產業發展最大的挑戰,可能并不是云計算資源的硬件建設,而是大量能夠掌握云計算核心技術的人才匱乏。由于歷史原因,原有的超級計算機往往被優先應用在國防、科研等高精尖領域,所以超級計算機的實際應用場合其實是相對狹小的,而超級計算機的利用方法和方式也并不普及。從歐美等發達國家的經驗來看,超級計算機對實體經濟的拉動和幫助作用并不大。如果各地陸續建成能進入T0P500名單的超級計算機,如何將其商用、如何將其民用,在技術和人才缺口上都是巨大的挑戰和難題。
像在內蒙、山西這樣能源充裕的地區,發展云計算產業基地在能源供應的地利上沒有問題,但在高端的云計算人才的“人和”方面還是匱乏的。從全國層面來說,也僅有阿里巴巴、百度等數量非常有限的公司掌握著核心的云計算技術和經驗。鐵道部網上售票系統,就是非常生動且殘酷的現實案例,不管愿望多美好,在用戶負荷變化劇烈的情況下,技術和管理不成熟的云計算資源都可能出現問題,這對于商用來說甚至是災難性的。
現在全球性的跨國公司在中國建立云計算中心的過程中,表現得積極又主動,非常樂于在技術和方案上幫忙,因為在這個過程中它們可以銷售出數量龐大的處理器芯片和其它硬件,但在云計算最終要靠應用服務和收費來實現產業鏈的貫通,在此方面這些國際巨頭并不能給我們太多實質性的幫助。在實際的應用開發環節,還主要得依靠自己的力量。由于目前進入T0P500的超級計算機采用的硬件標準和軟件系統各不相同,目前各地建成的超級計算機中心也自然是采用不同的標準,這就為實際應用時的程序開發帶來了巨大的困難,云計算標準需要在利益博弈中取得平衡和結果,全國各地在云計算中心的建設上如果各搞一套標準和方案,將來在實際運營中將出現巨大的隱患和麻煩。
第三,云計算產業目前在中國的發展現狀與它在理論上具有的優勢,存在著巨大的反差。云計算的目的和意義,就在于整合計算資源,提升計算資源的效率,從而讓用戶得到更為經濟實惠,而且方便易用的計算服務。
但在殘酷的現實中,云計算產業鏈上的任意一環出了問題,生意就可以虧本。比如超級計算機一旦運行,就面臨著數以千萬元甚至億元計算的電費開支,元件提供商總會說超級計算機每單位功率的計算能力是最優秀的,所以性能越高的計算資源越環保節能,但他們往往故意對一個關鍵指標忽略了,那就是實際的計算負荷水平。超級計算機的平均計算負荷水平通常來說都是非常低的,如果在排隊的計算任務不足以形成一定負荷的持續計算壓力,那么超大型計算機在商用市場的經濟性方面就毫無優勢可言。
超級計算機在作為國家戰略的執行工具時,可以不計成本,但如果商用,就必須直面成本和收益的考驗。
像淘寶在面臨著雙十二瘋狂促銷活動時,并非更換了性能更高的超級服務器,而是采用了低功率的服務器群組做平衡部署,原因就是真實的商業客戶必須要在經濟性和計算需求方面做好平衡。這才是真實的云計算商業需求和應用實例。而新聞通稿中經常出現的“迫切的”基因研究、氣象研究、地震預報等需求,其實也并不需要全國建十幾個超算中心來支撐其運行。
科技投入肯定要具備前瞻性和超前性,但全國各地如果都大上、特上云計算中心,一旦計算資源的增加遠遠高于需求,或者由于人才問題,使得云計算中心的負荷水平都處于低位,那么云計算的效率和成本優勢必將消失殆盡。
隨著國內網絡帶寬的提速,互聯計算會提升計算資源的利用率。但全國各地陸續發生過為保護本地啤酒,不讓外地啤酒品牌進入行政亂執法行為。在各地計算資源冗余的情況下,會不會出現依靠行政命令來干預對云計算服務選擇,這些都需要我們做針對性的預防。
如果云計算基地都是商業公司來運營,我覺得他們如何投資和選擇都是無可厚非,高科技行業必然要承擔較高的風險,并在優勝劣汰的過程中體現效率和成本的神奇作用;如果這些云計算或者超級計算中心,是政府投資或者國家財政支持,那就需要非常詳盡的投資時間表和計劃書,以及詳盡的投資回收率預算,并請清晰注明是哪些專家和學者在支持和贊同那些目標宏大的云計劃和云藍圖,原因和理由是什么。
民眾有無權利知道每個光輝的云計算產業數字背后需要多少血汗錢來支撐?投資云計算需要承擔多大的風險?誰將為這些風險來負責?而這些,恰恰是我在各地云計算發展藍圖中所未見,希望在下一張“云”圖上能夠看見。