面向云環(huán)境的遷移工作正如火如荼地進(jìn)行。在去年的Gartner IT研討博覽會上,超過半數(shù)CIO表示將把云優(yōu)先戰(zhàn)略作為接下來的運(yùn)營重心。Verizon公司在其《市場狀態(tài):2016年企業(yè)云》報(bào)告中提到,有84%的受訪企業(yè)表示其云使用量在過去一年中迎來顯著提升,而且有半數(shù)企業(yè)宣稱其到2018年至少將把75%工作負(fù)載遷移至云端。更值得一提的是,亦有半數(shù)受訪企業(yè)正在使用兩到四家云服務(wù)供應(yīng)商的產(chǎn)品。
無論大家正著眼于面向云環(huán)境的遷移、考量云產(chǎn)品線多樣化還是僅僅在比較跨越云環(huán)境的性能與價(jià)值水平,認(rèn)真審視以下五個(gè)關(guān)鍵性問題都能夠幫助各位做出更為理性的決策:
* 大家如何監(jiān)控自己的互聯(lián)網(wǎng)基礎(chǔ)設(shè)施?大家在對自己的內(nèi)部基礎(chǔ)設(shè)施與應(yīng)用程序進(jìn)行監(jiān)控時(shí),會收集到哪些負(fù)責(zé)將客戶與自身業(yè)務(wù)相對接的外部互聯(lián)網(wǎng)連接的相關(guān)信息?如果指向特定數(shù)據(jù)中心的連接發(fā)生故障,又或者某家云服務(wù)供應(yīng)商無法覆蓋特定市場區(qū)劃,大家的系統(tǒng)管理員必須擁有必要工具以將流量重新路由至其它數(shù)據(jù)中心,從而保證服務(wù)的正常運(yùn)轉(zhuǎn)。另外,如果大家遭遇高延遲或者服務(wù)質(zhì)量下降,您的IT團(tuán)隊(duì)也必須了解如何監(jiān)控這些問題并對性能做出及時(shí)優(yōu)化。
另一個(gè)需要認(rèn)真考量的問題在于了解自己的“平均解決時(shí)間”——即能夠以何種速度精確識別造成客戶影響的問題根源,其具體來源可能包括應(yīng)用程序、數(shù)據(jù)中心計(jì)算環(huán)境,又或者基于互聯(lián)網(wǎng)路由、宕機(jī)乃至云/SaaS供應(yīng)商。雖然云服務(wù)供應(yīng)商、CDN以及加速服務(wù)方都宣稱能夠提供“始終在線”承諾,但這并不意味著客戶總能夠順利與之相對接。
*如果大家立足于一家全球性企業(yè),該如何確保云環(huán)境下的全球可用性? 如果大家的最終用戶會立足于全球任意位置對您的互聯(lián)網(wǎng)資產(chǎn)進(jìn)行全天候訪問,那么各位無疑需要確保自己的最終用戶體驗(yàn)在各個(gè)位置保持對等——無論其于何時(shí)、何地訪問我們的網(wǎng)站、應(yīng)用或者內(nèi)容。保障可用性意味著如果我們的服務(wù)是否可用于客戶及合作伙伴。要實(shí)現(xiàn)這項(xiàng)目標(biāo),最重要的一點(diǎn)在于了解我們所選定之云服務(wù)供應(yīng)商與CDN的網(wǎng)絡(luò)連接性能。
2015年發(fā)生的谷歌云宕機(jī)事故持續(xù)近兩小時(shí),其根源在于虛擬網(wǎng)絡(luò)流量路由機(jī)制中的一項(xiàng)軟件問題。如果大家的業(yè)務(wù)使用單一云實(shí)例配合谷歌云客戶端,而各位又沒有對網(wǎng)絡(luò)可用性進(jìn)行全程監(jiān)控,那么大家很可能會全面遭遇這場宕機(jī)并導(dǎo)致可用性受到嚴(yán)重影響。
因此,我們該如何確保自己的業(yè)務(wù)能夠擁有強(qiáng)大的可用性,而不至于受到本地互聯(lián)網(wǎng)狀態(tài)或者世界各地區(qū)域網(wǎng)絡(luò)條件的限制?將業(yè)務(wù)分布托管在多家云服務(wù)供應(yīng)商站點(diǎn)中能夠確??蛻裘馐軉握净蛘邌我粎^(qū)域宕機(jī)的影響。作為另一項(xiàng)建議,大家還應(yīng)當(dāng)監(jiān)控自己的全球網(wǎng)絡(luò),從而檢測其當(dāng)前負(fù)載水平。我們需要關(guān)注性能問題,并利用現(xiàn)有工具進(jìn)行負(fù)載均衡,從而確保整套業(yè)務(wù)體系隨時(shí)擁有理想的可用性水平。
*使用單一云服務(wù)供應(yīng)商即可,還是應(yīng)當(dāng)考慮選擇多家供應(yīng)商?雖然各家云服務(wù)供應(yīng)商所能提供的方案千差萬別,但同時(shí)使用多家服務(wù)是實(shí)現(xiàn)業(yè)務(wù)持續(xù)性與風(fēng)險(xiǎn)緩解戰(zhàn)略的惟一途徑。我們還可以利用這種有效策略管理峰值使用量、成本波動與全球負(fù)載均衡。
同時(shí)選擇多家云服務(wù)供應(yīng)商能確保我們的企業(yè)訪問不同云實(shí)例(本地),從而立足于本地市場考量客戶需求并充分利用本地網(wǎng)絡(luò)連接的性能優(yōu)勢。而跨地理位置使用高級DNS流量管理解決方案,則能夠幫助大家確切控制由哪些實(shí)例服務(wù)哪些客戶,同時(shí)通過正確工具以集中化方式對各類實(shí)例乃至供應(yīng)商服務(wù)加以管理。
同時(shí)選擇多種云方案能夠幫助我們的業(yè)務(wù)擁有更出色的靈活性與價(jià)值回報(bào),允許大家提供規(guī)??缮炜s且始終在線之業(yè)務(wù)印象。這種訪問不同路徑的能力還能夠切實(shí)解決系統(tǒng)宕機(jī)或者載入速度過慢等問題——無論其源自流量路由問題還是惡意攻擊。除此之外,選擇多家云服務(wù)供應(yīng)商還能幫助大家盡快對流量進(jìn)行重新路由,從而確保將中斷狀況控制在最低水平。作為額外收益,選擇多家云服務(wù)供應(yīng)商還允許大家將應(yīng)用程序與服務(wù)部署在兩個(gè)(或者更多)云實(shí)例當(dāng)中,這樣它們就能夠利用全局負(fù)載均衡或者故障轉(zhuǎn)移架構(gòu)實(shí)現(xiàn)相互備份,從而在問題發(fā)生之前建立保護(hù)措施。
*優(yōu)化互聯(lián)網(wǎng)性能的最大風(fēng)險(xiǎn)是什么?最大的風(fēng)險(xiǎn)在于大家可能并不了解業(yè)務(wù)性能的實(shí)時(shí)狀態(tài)——其中包括互聯(lián)網(wǎng)延遲問題來源、全局可用性與可接入能力等以及最終用戶的真實(shí)性能體驗(yàn)如何。在潛在客戶訪問域名與正式打開頁面之間的時(shí)間段內(nèi),種種意外狀況都有可能突然發(fā)生。網(wǎng)絡(luò)內(nèi)部可能出現(xiàn)CDN或者ISP層級的錯(cuò)誤,大家的SaaS供應(yīng)商或者客戶自己的網(wǎng)絡(luò)連接也可能遭遇故障。另外,網(wǎng)站響應(yīng)速度也會受到多種因素的影響,而且大多數(shù)客戶——乃至企業(yè)客戶——往往并不清楚遭遇性能問題的原因與方式。
通道故障、路由異常、延遲、丟包、安全威脅(例如中間人攻擊與DDoS)還僅僅是影響流暢網(wǎng)絡(luò)運(yùn)轉(zhuǎn)的常見風(fēng)險(xiǎn)中的一小部分。了解自己的網(wǎng)絡(luò)連接并對其加以監(jiān)視、控制與優(yōu)化,同時(shí)對互聯(lián)網(wǎng)性能切實(shí)加以測試,只有這樣才能真正掌握并應(yīng)對網(wǎng)絡(luò)中的各類薄弱環(huán)節(jié)。
*在遭遇宕機(jī)事故時(shí),我們該如何保證站點(diǎn)正常在線?宕機(jī)會給企業(yè)的正常業(yè)務(wù)造成嚴(yán)重影響,而且出現(xiàn)存在著令人驚訝的規(guī)律性——每天全球互聯(lián)網(wǎng)會出現(xiàn)超過3000次宕機(jī)狀況。另外,大多數(shù)企業(yè)其實(shí)很難在不涉及客戶與內(nèi)部資產(chǎn)的前提下,對互聯(lián)網(wǎng)連接故障進(jìn)行檢測。
對面向互聯(lián)網(wǎng)架構(gòu)的不斷監(jiān)控是惟一能夠確保企業(yè)自身免受宕機(jī)長期影響的可行手段。如果大家無法妥善檢測宕機(jī)問題,那么各位的業(yè)務(wù)將無法真正對銷售額損失、營收下滑乃至客戶流失等風(fēng)險(xiǎn)進(jìn)行響應(yīng)與緩解。有鑒于此,物色一家真正有能力洞察我們基礎(chǔ)設(shè)施的合作伙伴將幫助大家積極應(yīng)對宕機(jī)風(fēng)險(xiǎn),包括在宕機(jī)出現(xiàn)之前或者之中發(fā)現(xiàn)問題、即時(shí)做出改道決策等等。