“都是被逼的,在成本和技術(shù)的雙重壓力下,我們不得不對現(xiàn)有的IT系統(tǒng)進(jìn)行調(diào)整和優(yōu)化,最終從傳統(tǒng)IT架構(gòu)走上了開源的、分布式架構(gòu)。”面對至頂網(wǎng)記者,中國鐵路信息技術(shù)中心技術(shù)支持部部長高明星坦言。
高明星所在的中國鐵路信息技術(shù)中心承擔(dān)了中國鐵路總公司本地信息系統(tǒng)的建設(shè)和運(yùn)維任務(wù),其中就包括我們所熟知的12306網(wǎng)站的后臺保障。隨著公司業(yè)務(wù)規(guī)模越來越大,數(shù)據(jù)中心從一個增加到多個,服務(wù)器規(guī)模近萬臺的時(shí)候,不管是管理和運(yùn)維的成本還是對新應(yīng)用的支撐都給中國鐵路信息技術(shù)中心帶來很大的壓力。在這樣的背景之下,中國鐵路信息技術(shù)中心不得不尋求解決之道,IT優(yōu)化就是其中之一。
實(shí)際上,中國鐵路信息技術(shù)中心這個經(jīng)歷并不是個例,今天的IT已經(jīng)融入企業(yè)日常運(yùn)營的點(diǎn)點(diǎn)滴滴之中,在不少企業(yè)中IT甚至成為企業(yè)運(yùn)營中的一部分,企業(yè)業(yè)務(wù)也越來越離不開IT的支持,持續(xù)優(yōu)化IT成為越來越多公司共同的選擇。
點(diǎn)擊查看《企業(yè)開源智庫》之IT優(yōu)化高端對話視頻
壓力之下的IT優(yōu)化之路
作為中國鐵路總公司本地信息系統(tǒng)的建設(shè)者和維護(hù)者,中國鐵路信息技術(shù)中心的壓力主要來自幾個方面:一個是企業(yè)規(guī)??焖贁U(kuò)展。中國鐵路總公司的信息化建設(shè)經(jīng)過了40多年,特別是最近20多年的高速發(fā)展,機(jī)房面積已經(jīng)擴(kuò)張到2000多平米,上萬臺/套的IT設(shè)備在運(yùn)行,新數(shù)據(jù)中心也在規(guī)劃之中,這么大的規(guī)模給運(yùn)維帶來了很大挑戰(zhàn)。另一個壓力來自業(yè)務(wù)對信息系統(tǒng)的要求?,F(xiàn)在信息系統(tǒng)和業(yè)務(wù)的捆綁已經(jīng)越來越緊,有些信息系統(tǒng)是跟生產(chǎn)過程緊密捆綁的。信息系統(tǒng)如果中斷或者發(fā)生故障對業(yè)務(wù)的影響也是非常大。
“12306網(wǎng)站就是一個很好的例子,如果后臺運(yùn)行出現(xiàn)故障,輕的影響旅客用戶體驗(yàn),重的影響旅客購票。那就是一件大事情。”高明星表示。
第三,中國鐵路總公司自己目前也是處在一個轉(zhuǎn)型的階段,從過去的政府部門轉(zhuǎn)變成一個企業(yè),為走好轉(zhuǎn)型之路總公司對IT提出了更高的需求,這也是一個壓力。
這些壓力傳導(dǎo)到IT部門,對IT部門而言核心就是要解決好兩個問題,一個是經(jīng)濟(jì)上,即要控制成本;另一個是技術(shù)上,即要突破技術(shù)瓶頸及實(shí)現(xiàn)自主可控。“當(dāng)IT資產(chǎn)從幾百萬、幾千萬到幾十億的時(shí)候,如果IT的基礎(chǔ)架構(gòu)本身不方便運(yùn)維管理,如果沒有自動化的工具、沒有標(biāo)準(zhǔn)化的流程,是很難做的,所以說IT的優(yōu)化首先是成本的壓力。其次,從技術(shù)的角度而言,IT要更加敏捷地滿足業(yè)務(wù)上線的需求。另外,國家對安全和自主可控方面現(xiàn)在越來越重視,這些也需要借助IT來落實(shí)。”高明星表示。
對于傳統(tǒng)企業(yè)面臨的這些壓力,紅帽首席解決方案架構(gòu)師張家駒也是感同身受。作為一名開源技術(shù)的資深從業(yè)者,張家駒常常接到客戶這方面的咨詢請求,希望幫助他們更好地應(yīng)對成本和技術(shù)壓力。張家駒告訴至頂網(wǎng)記者,過去傳統(tǒng)企業(yè)面對的是傳統(tǒng)業(yè)務(wù),年初做預(yù)算,什么都規(guī)劃好了,就按照這個步驟來。然而,今天整個世界變得敏捷了,出現(xiàn)了很多不確定性的因素,在這種背景下傳統(tǒng)企業(yè)一定要做轉(zhuǎn)變,必須擁抱新的技術(shù),需要對IT系統(tǒng)進(jìn)行調(diào)整和優(yōu)化。
訪談中,張家駒告訴至頂網(wǎng)記者,傳統(tǒng)企業(yè)對新技術(shù)的態(tài)度要比大家預(yù)想的積極得多。“我們看到越來越多的傳統(tǒng)企業(yè)愿意去嘗試新的事物,雖然在嘗試過程中可能會遇到這樣或者那樣的一些問題,這個時(shí)候可能借助于一些外部的力量,比如說一些廠商的支持,來逐步實(shí)現(xiàn)從傳統(tǒng)逐漸向新型業(yè)務(wù)轉(zhuǎn)變。”張家駒表示。
實(shí)際上,正如張家駒所言,在中鐵信息技術(shù)中心的一路前行過程中,就有紅帽等多個廠商的幫助和支持,這也是中鐵信息技術(shù)中心放手投入開源的底氣所在。
標(biāo)準(zhǔn)化、自動化與云化
壓力之下的中國鐵路信息技術(shù)中心把目光投向了IT優(yōu)化,逐步引入開放系統(tǒng)、虛擬化和一些開源的技術(shù),并開啟了長期的、持續(xù)不斷的IT優(yōu)化之路。其中,2010年時(shí)一個關(guān)鍵時(shí)間點(diǎn)。
高明星解釋說,早期的中國鐵路信息化主要基于專有系統(tǒng),包括大型機(jī)和各種小型機(jī)。到2010年時(shí),中國鐵路信息化出現(xiàn)了重要的變化,從過去面向內(nèi)部的生產(chǎn)經(jīng)營管理為主,到面向主動為旅客貨主提供服務(wù),此時(shí)信息系統(tǒng)面臨的壓力和需求規(guī)模突然攀升,在這種情況下,沿用傳統(tǒng)的專有系統(tǒng)從成本上考慮就不可行了。
“從2014年到2015年開始,我們被迫轉(zhuǎn)向x86平臺,并從x86平臺延伸到基于Linux的開源系統(tǒng),到后來的云計(jì)算,就這么一路走來了。”高明星告訴至頂網(wǎng)記者。
據(jù)悉,整個過程中中國鐵路信息技術(shù)中心學(xué)習(xí)了很多互聯(lián)網(wǎng)公司的做法,包括虛擬化、標(biāo)準(zhǔn)化、自動化以及云化等IT優(yōu)化的普遍做法。以12306網(wǎng)站為例,其最大的壓力來自余票查詢。因?yàn)閹缀趺總€人完成購票之前,都會進(jìn)行多次余票查詢。要保證用戶的查詢體驗(yàn),后臺就需要很好地應(yīng)對高并發(fā)的查詢需求。
高明星介紹說,“剛開始采取的辦法是采用關(guān)系型數(shù)據(jù)庫,通過增加服務(wù)器處理能力來應(yīng)對,一臺不行上10臺、上100臺,隨后發(fā)現(xiàn)這種思路仍然無法滿足在高峰期查詢的需求,后來轉(zhuǎn)向分布式架構(gòu),采用了分庫分表的辦法解決這個問題。”
正是因?yàn)橹袊F路信息技術(shù)中心在滿足業(yè)務(wù)需求時(shí)遇到的挑戰(zhàn)更大,對此體會更深,所以,相比一般傳統(tǒng)企業(yè),它們在開源系統(tǒng)和云計(jì)算的道路都走得更堅(jiān)決、更快。比如,在開源上,不只是選擇了紅帽的Linux、虛擬化等基礎(chǔ)平臺,還選擇了Ceph,構(gòu)建了基于Ceph的分布式存儲系統(tǒng)。甚至在云計(jì)算的道路上,選擇的也是基于OpenStack的開源云平臺。
“我們希望把命運(yùn)多掌控一些在自己的手里,多一些自主可控。”高明星談及這些選擇時(shí)表示。
要優(yōu)化,更要可靠
雖然中國鐵路信息技術(shù)中心一路走來,看起來比較激進(jìn),也比較堅(jiān)決,但實(shí)際上每一步走得都非常扎實(shí),并沒有急躁冒進(jìn)。比如,在正式轉(zhuǎn)向開源系統(tǒng)、遷移到x86+Linux平臺之前,中國鐵路信息技術(shù)中心曾對開源平臺的安全和可靠性經(jīng)過了兩三年考驗(yàn)期。
“在確定了要走開源路線之后,我們積極進(jìn)行了各種準(zhǔn)備,包括提升自身的能力。我們依托自己內(nèi)部的力量,包括下屬的公司,還組建了一支隊(duì)伍專門去研究開源,研究云計(jì)算。”高明星說,因?yàn)椴捎昧藵u進(jìn)的思路,在漸進(jìn)過程中逐步建立起了信心,現(xiàn)在才有足夠的底氣宣布要走開源之路。
而值得一提的是,在整個遷移過程,“可靠”一直是中國鐵路信息技術(shù)中心最優(yōu)先考慮的。高明星透露,“可靠”是比“成本”等更為重要的考量,在可靠性面前成本位居第二,所有優(yōu)化的前提是要保證可靠性?;谶@個原因,中國鐵路信息技術(shù)中心做了大量的驗(yàn)證測試工作,包括數(shù)據(jù)庫跑在Linux平臺、用Ceph存儲來支持Web服務(wù)等。
“對于我們來說,開源、分布式計(jì)算是有技術(shù)挑戰(zhàn)的,同時(shí)我們的業(yè)務(wù)是不能出錯的。我們要在這個路上走得更穩(wěn)當(dāng),就要做很多的工作,包括測試、驗(yàn)證以及架構(gòu)的設(shè)計(jì)。”高明星表示。
基于這個考慮,目前中國鐵路信息技術(shù)中心核心數(shù)據(jù)庫還是跑在x86物理服務(wù)器上,并沒有一刀切地采用虛擬化。同時(shí),在架構(gòu)上中國鐵路信息技術(shù)中心也做了特別的設(shè)計(jì),采用了雙平臺,即核心業(yè)務(wù)系統(tǒng)后臺采用了開源和閉源平臺并舉,通過負(fù)載均衡系統(tǒng)提供給前端,支撐業(yè)務(wù)的運(yùn)行,同時(shí)屏蔽了后臺的異構(gòu)。
“目前這個架構(gòu)資源池比例可能是五五開,后期會隨著我們自主研發(fā)程度的逐步提升,進(jìn)一步提高開源架構(gòu)資源池的比例。這樣做的好處是容錯能力大大提升了,讓我們的轉(zhuǎn)型之路也能走得更平穩(wěn)性。”高明星表示。
很顯然,中國鐵路信息技術(shù)中心的轉(zhuǎn)型之路走得相對順利和平穩(wěn),與公司在這方面的看似激進(jìn)實(shí)則穩(wěn)健的工作風(fēng)格不無關(guān)系。頗有意思的是,在長期與傳統(tǒng)企業(yè)客戶打交道的張家駒看來,這其實(shí)也是很多傳統(tǒng)企業(yè)特別是大型企業(yè)的普遍做法。
“中國鐵路信息技術(shù)中心給我們很好的一個例子,應(yīng)該如何在傳統(tǒng)技術(shù)和新技術(shù)之間,或者閉源和開源技術(shù)之間達(dá)到有效的平衡,也就是如何隨著技術(shù)的成熟逐漸會加大我們使用開源的新興技術(shù)的比例,而不是單純地冒進(jìn)。”張家駒評價(jià)說,“總之,業(yè)務(wù)優(yōu)先,只有把業(yè)務(wù)問題解決了,才能談IT優(yōu)化,談轉(zhuǎn)型。”
工業(yè)控制系統(tǒng)邁向開放 你想好如何進(jìn)行安全防范了嗎?