云對(duì)IDC的壓力
近幾年,隨著云服務(wù)商的興起,及云計(jì)算的日趨成熟,集中式云計(jì)算已慢慢成為主流的趨勢(shì),越來越多的中小型公司不再自行購(gòu)買服務(wù)器,直接購(gòu)買云服務(wù)來完成自身的IT支撐業(yè)務(wù)。
大型互聯(lián)網(wǎng)公司的IDC,從托管自身業(yè)務(wù)起家,支撐其海量的互聯(lián)網(wǎng)業(yè)務(wù)及產(chǎn)品,服務(wù)于億萬網(wǎng)民。慢慢的,為其業(yè)務(wù)支撐的建設(shè)的IDC及網(wǎng)絡(luò)、積累的技術(shù)和經(jīng)驗(yàn),已變成了IDC業(yè)界難得的資源。因此大型互聯(lián)網(wǎng)公司也順勢(shì)把自己的IDC開放出來,對(duì)外提供云服務(wù)。
托管在云上的都是商業(yè)客戶,大多數(shù)對(duì)業(yè)務(wù)可用性要求非常高。IDC通過云的方式開放以后,這種壓力也自然傳遞給了IDC側(cè),一旦IDC出現(xiàn)較大的故障,很可能立刻變成公關(guān)事件。和以前純內(nèi)部業(yè)務(wù)的時(shí)代,現(xiàn)在的IDC運(yùn)營(yíng)商為此也面臨更大的壓力。
IDC運(yùn)營(yíng)經(jīng)驗(yàn)積累不易
數(shù)據(jù)中心整套系統(tǒng)非常復(fù)雜,包括大樓建筑、電力系統(tǒng)、空調(diào)系統(tǒng)、消防系統(tǒng)、防雷系統(tǒng),安全系統(tǒng)、監(jiān)控系統(tǒng)、網(wǎng)絡(luò)系統(tǒng)等,產(chǎn)品多樣復(fù)雜,單個(gè)系統(tǒng)的維護(hù)是門大學(xué)問。此外數(shù)據(jù)中心的各個(gè)系統(tǒng)又是聯(lián)動(dòng)的整體,不同子系統(tǒng)都相互關(guān)聯(lián),相互影響。例如市電中斷導(dǎo)致空調(diào)系統(tǒng)的臨時(shí)中斷,消防系統(tǒng)的誤報(bào)警導(dǎo)致空調(diào)自動(dòng)控制系統(tǒng)的鎖死,任何一個(gè)系統(tǒng)的小問題都可能影響到整個(gè)機(jī)房關(guān)鍵系統(tǒng)的宕機(jī),這直接對(duì)數(shù)據(jù)中心的整體可靠性管理帶來巨大的挑戰(zhàn)。
在整個(gè)數(shù)據(jù)中心的安全保障需要整體管理和執(zhí)行,自動(dòng)化系統(tǒng)和人工預(yù)案的并重。運(yùn)營(yíng)的可靠性是貫穿整個(gè)生命周期的,前期建設(shè)埋下隱患,直接影響到運(yùn)營(yíng)。因此經(jīng)驗(yàn)的沉淀至關(guān)重要,而且不簡(jiǎn)單,一個(gè)可靠的數(shù)據(jù)中心的經(jīng)驗(yàn)沉淀需要很多年。一個(gè)合格的數(shù)據(jù)中心技術(shù)人員,其技術(shù)積累積累需要走很多年。4個(gè)9的保障難,5個(gè)9保障更難。
互聯(lián)網(wǎng)云的對(duì)IDC的使命
IDC如何提升運(yùn)營(yíng)水平,保障業(yè)務(wù)的可用性?通過培訓(xùn)?通過找第三方咨詢顧問?通過數(shù)據(jù)中心之間的人員流動(dòng)和互相挖角?
BAT這樣的大型互聯(lián)網(wǎng)公司,都經(jīng)歷了租用,合建,自建IDC的歷程,其IDC規(guī)模從幾十個(gè)到百多個(gè),跨多個(gè)省市,多個(gè)IDC運(yùn)營(yíng)商,經(jīng)驗(yàn)遍布全球。各個(gè)IDC的基礎(chǔ)設(shè)施情況不同,運(yùn)營(yíng)水平有高有低。拿騰訊來說,騰訊自QQ業(yè)務(wù)開始,歷程15年的IDC建設(shè)及運(yùn)營(yíng)經(jīng)驗(yàn),服務(wù)器量從數(shù)萬到數(shù)十萬,扛住了海量業(yè)務(wù)的挑戰(zhàn),而且在大量的運(yùn)維故障處理、運(yùn)營(yíng)優(yōu)化工作中積累了豐富而寶貴的經(jīng)驗(yàn)。為了保障業(yè)務(wù)的可靠性運(yùn)營(yíng),騰訊早些年開始慢慢摸索與各大運(yùn)營(yíng)商聯(lián)合運(yùn)營(yíng)的機(jī)制,借助騰訊從百家提煉總結(jié)出來的經(jīng)驗(yàn),以預(yù)防故障作為出發(fā)點(diǎn),尤其是與一線的機(jī)房運(yùn)維團(tuán)隊(duì)開了密切的交流與學(xué)習(xí),分享經(jīng)驗(yàn),傳遞最佳實(shí)踐等。同時(shí)慢慢開始雙方的聯(lián)合巡檢、聯(lián)合排查、聯(lián)合整治的工作。一個(gè)故障,不要在其他IDC重現(xiàn),一個(gè)隱患,能引起其余IDC的重視。就以這樣“開放、分享、交流”出發(fā)點(diǎn),聯(lián)合運(yùn)營(yíng)的模式贏得了多方的認(rèn)可,也頗見成效。在一個(gè)共贏的平臺(tái)上,各方共享了高可靠IDC保障的技能,迅速學(xué)習(xí)了業(yè)界的技術(shù)經(jīng)驗(yàn)和最佳實(shí)踐。
只有與下游的IDC密切聯(lián)合起來,才能保障上游的業(yè)務(wù)。騰訊除了自身積累的經(jīng)驗(yàn)分享給IDC服務(wù)商之外,還把“聯(lián)合運(yùn)營(yíng)”提升到更高的層次,上升到雙方高效溝通、規(guī)范流程體系、數(shù)據(jù)量化、聯(lián)合優(yōu)化、知識(shí)共享、平臺(tái)對(duì)接等。一方面保障了騰訊的業(yè)務(wù),同時(shí)各大運(yùn)營(yíng)商也隨之得到不斷進(jìn)步,創(chuàng)造多方共贏。隨著聯(lián)合運(yùn)營(yíng)的廣泛落地,騰訊最近幾年在基礎(chǔ)設(shè)施層面的重大故障幾乎為零,與騰訊合作的眾多IDC的運(yùn)營(yíng)水平也隨之得到顯著提升。
像騰訊、百度、阿里這樣,擁有海量IDC的互聯(lián)網(wǎng)企業(yè),借助自身業(yè)務(wù)運(yùn)營(yíng)的經(jīng)驗(yàn),把下游的IDC資源、網(wǎng)絡(luò)資源、IT資源等整合,以云的方式把IDC開放出來,為上游的云客戶提供計(jì)算服務(wù)。云市場(chǎng)需求越大,IDC的需求也越大。也正因?yàn)檫@樣,云革命的年代,這些大型的互聯(lián)網(wǎng)公司在某種意義上被賦予了更高的使命,通過“云”這個(gè)特殊的媒介,與下游產(chǎn)業(yè)每一家IDC形成天然的結(jié)盟,相互分享經(jīng)驗(yàn),完善運(yùn)營(yíng)體系,落實(shí)最佳實(shí)踐,進(jìn)而實(shí)現(xiàn)多方共贏,最后促進(jìn)整個(gè)產(chǎn)業(yè)的進(jìn)步。