俗話說干柴烈火一碰即著,運(yùn)維加上云計(jì)算,也會(huì)起到這樣的化學(xué)反應(yīng),尤其是游戲運(yùn)維。游戲運(yùn)維加上云計(jì)算,兩者融合在一塊兒,就猶如小說里面的干柴烈火掌威力大增,不僅提高了運(yùn)維人員的工作效率,也對運(yùn)維人員提出了更高的要求。
一個(gè)技術(shù),一個(gè)平臺(tái),甚至是一個(gè)產(chǎn)業(yè),從萌芽狀態(tài)發(fā)展到成熟狀態(tài),它需要一個(gè)很漫長的過程,也可能幾年、十幾年。那么,云平臺(tái),帶給我們高效率和便捷性的同時(shí),大家也別忘了它現(xiàn)在還有一些不成熟性,還暗藏著一把情意綿綿刀,這個(gè)刀出鞘是要見血的,甚至有時(shí)候是要?dú)⑷说摹J裁词乔橐饩d綿刀,就是各種坑。大家在不了解的時(shí)候,去使用云平臺(tái),可能會(huì)被坑的你暈頭轉(zhuǎn)向,甚至導(dǎo)致業(yè)務(wù)會(huì)崩潰。我們使用了云平臺(tái)之后,那么一定會(huì)有一部分的工作被替代掉,那么被替代掉的這部分工作就是我們的技術(shù)工作。現(xiàn)在很多運(yùn)維人員來講,是不是運(yùn)維人員的末日?是,也不是。基礎(chǔ)運(yùn)維,肯定會(huì)被替代掉,但是更高級一點(diǎn)的運(yùn)維,面向業(yè)務(wù)的應(yīng)用層的、開發(fā)層的,肯定不會(huì)被替代掉,而且會(huì)越來越好。那么我們舍棄了個(gè)基礎(chǔ)運(yùn)維,我們得到了什么東西?我們得到更多的是個(gè)人能力的提升。比如說,你的技術(shù)能力,比如說你的溝通能力,比如說你的思維能力,它會(huì)對你個(gè)人整體提出更高的要求。那么我們看一下,我們具體到底舍棄了哪些工作?
一方面,就是我們即將要舍棄的工作,比如說IDC,比如說服務(wù)器采購、服務(wù)器上線、網(wǎng)絡(luò)等等。
另一方面,是我們更加關(guān)注和需要提升自己的部分,比如說服務(wù)質(zhì)量,業(yè)務(wù)層面的、自動(dòng)化、平臺(tái)、成本,包括未來的智能化。
為什么說游戲運(yùn)維碰到云計(jì)算就是干柴烈火?就是天作之合呢?這個(gè)需要從我們的具體業(yè)務(wù)類型去分析。非游戲項(xiàng)目包括像門戶網(wǎng)站、社交、視頻、電商等,他的產(chǎn)品有什么特性?
第一,他的單一性。比如說做社交的就是做社交。他的持續(xù)性,做的好,能夠持續(xù)三五年,甚至更長的時(shí)間。那的穩(wěn)定性,從產(chǎn)品角度來講,它是穩(wěn)健增長的,它是環(huán)式衍生,比如說做完社交,其他的產(chǎn)品都是圍繞著社交去做的。這個(gè)產(chǎn)品帶給運(yùn)維的是什么呢?第一個(gè)容易標(biāo)準(zhǔn)化,第二你有足夠的推動(dòng)能力,它就容易標(biāo)準(zhǔn)化,它容易統(tǒng)一架構(gòu)。在技術(shù)層面,可以更加持續(xù)的深入進(jìn)去去研究。它的穩(wěn)定性相對來說比較高。我們看一下游戲項(xiàng)目,像包括端游、手游、頁游,還有現(xiàn)在的微端,它的特性有多重性、周期性、多變和分散式衍生。多重性是指什么?就是稍微大的游戲公司不可能支持一款游戲,他有很多款游戲。周期性,搞游戲的都知道一款游戲是有生存周期的,像現(xiàn)在的游戲,頁游、手游生存周期一般是在一年時(shí)間,兩年算長的,到三年就是奇跡。如果三年還能盈利,絕對是個(gè)奇跡,做的非常好。多變,多變是指這個(gè)項(xiàng)目的多變性。一款游戲從研發(fā)到上線,中間可能出現(xiàn)N多種變數(shù),比如說順利的,三個(gè)月之后就可以上線,不順利的三個(gè)月之后回爐。它的分散式衍生,就是所有公司產(chǎn)品衍生的東西,都是跟當(dāng)前項(xiàng)目沒有太多關(guān)系,可以說都是獨(dú)立的。所以這種特性給我們運(yùn)維帶來什么?一個(gè)是不容易標(biāo)準(zhǔn)化,也不易統(tǒng)一架構(gòu),技術(shù)結(jié)構(gòu)變化比較大,穩(wěn)定性相對非游戲項(xiàng)目來說,比較低。
游戲項(xiàng)目,它有一些具體的需求。因?yàn)椋覀兯龅囊磺卸际前凑者@個(gè)需求來的。我們看看游戲公司,它對業(yè)務(wù)的需求。最高的時(shí)候,有5000個(gè)節(jié)點(diǎn),在云平臺(tái)上面,每天的波動(dòng)。每天的波動(dòng)是什么?就是增加的服務(wù)器數(shù)量和退還的服務(wù)器數(shù)量,最高的時(shí)候有800臺(tái),最少的時(shí)候有30臺(tái)左右。然后有數(shù)百個(gè)項(xiàng)目,幾十個(gè)研發(fā)團(tuán)隊(duì),項(xiàng)目周期還不穩(wěn)定,從三個(gè)月到三年。
各個(gè)項(xiàng)目之間,沒有太多關(guān)聯(lián)性,項(xiàng)目多平臺(tái)、多語言、多版本。然后還有第三方合作的管理。大家試想一下,如果說這些需求增加到各位自己的身上是個(gè)什么場景?我們來暢想一下,假如說你的領(lǐng)導(dǎo)跟你說,我們現(xiàn)在有5000千服務(wù)器節(jié)點(diǎn),你用Excel去搞一下,是不是覺得很崩潰?第一天可能覺得還好,有耐心的同事可能慢慢去弄,到了第二天的時(shí)候,緊接著會(huì)跟你說,今天我們這個(gè)項(xiàng)目增加到800臺(tái)服務(wù),其他項(xiàng)目減少到幾百臺(tái)服務(wù)器,你再重新整一遍,是不是很崩潰?
還有這種多個(gè)研發(fā)團(tuán)隊(duì)。多個(gè)研發(fā)團(tuán)隊(duì)里面,大家本公司的平時(shí)都認(rèn)識(shí),還有更多的可能,你們連面都沒見過,這么多東西怎么去管理?如果要滿足上面所有的需求,我們要靠人力、靠Excel是根本不可能的。不是說人員成本和管理成本,像這樣復(fù)雜多變的需求,時(shí)間長了肯定會(huì)出現(xiàn)很多問題。
胡萊游戲HOPS平臺(tái),主要是三層,最底層還是大家所熟悉的CMDB。CMDB,除了原始的CMDB以外,還定義一個(gè)數(shù)據(jù)收集,這一層僅限于收集所有的靜態(tài)資源。比如說像軟硬件、項(xiàng)目、第三方、人。
我們把所有的操作層面放到了第二層管理平臺(tái),這一部分主要做功能整合,比如說權(quán)限、API、自動(dòng)化部署、項(xiàng)目代碼管理、成本、故障,OpenStack、公有云,我們通過API去管理。
然后第三層是我們的業(yè)務(wù)支持平臺(tái),業(yè)務(wù)支持平臺(tái)主要是供向運(yùn)維、產(chǎn)品、商務(wù)、財(cái)務(wù)去做的。
產(chǎn)品是驅(qū)動(dòng)技術(shù)的第一因素,技術(shù)本身來講,它是沒有價(jià)值的,它只有轉(zhuǎn)化成產(chǎn)品,不管什么樣的轉(zhuǎn)化,他只有轉(zhuǎn)化成產(chǎn)品以后,有了交易,他才有價(jià)值。
如何選擇云平臺(tái)?
我們選擇云平臺(tái),我們選擇一樣?xùn)|西肯定是跟你的需求或者說跟你的愛好有關(guān)。我們選擇一門技術(shù),或者說選擇一個(gè)平臺(tái),對我們運(yùn)維來講只有兩個(gè)因素:成本和需求。一定是跟自己業(yè)務(wù)相關(guān)的。怎么去計(jì)算這個(gè)成本是不是合適,其實(shí)這個(gè)是有一些公式可以計(jì)算的。采用直接的托管和采用公有云,它中間是跟你的業(yè)務(wù)有一個(gè)連接點(diǎn),計(jì)算出來。在這個(gè)連接點(diǎn)之內(nèi),你的托管,你的自建肯定是合適的,省成本。但是對于游戲運(yùn)維來講,超過這個(gè)臨界點(diǎn),屬于公有云,肯定省成本的。
那么我們選擇云平臺(tái)是不是有標(biāo)準(zhǔn)呢?
首先有一個(gè)標(biāo)準(zhǔn),就是可控。可控包括兩個(gè)方面,一個(gè)是行為可控,第二個(gè)是人為可控。行為可控主要是指云平臺(tái)上面的技術(shù),你自己都能搞定,能hold的住,這是很重要的。第二個(gè)人為可控,是指什么呢?就是說在你搞不定的時(shí)候,你要能從業(yè)務(wù)角度上,能第一時(shí)間找到你的接口人。從目前國內(nèi)云平臺(tái)的環(huán)境來說,這兩點(diǎn)缺一不可。
簡潔運(yùn)維是一個(gè)思想,它不是一個(gè)標(biāo)準(zhǔn),它也不是一個(gè)概念,它是一種具有追求極致的工匠精神,它想達(dá)到的效果。所以說,簡潔并不等于簡單。