每一個云計算供應商,從谷歌到Rackspace,從亞馬遜到Salesforce.com,都曾經遇到過斷電的困擾。當這些斷電情況突發時,懷疑論者們就開始質疑云計算的可行性。
與任何一個樂于投資于云的人談談吧,你不需要花太長時間就能理解這些斷電事件僅僅是云事業中的一項成本而已。可是,那又如何?
斷電現象幾乎會發生在我們所消費的每一項服務中。今天,即便iPhone 4有著驚人的掉話率,蘋果公司仍在享受著創記錄的利潤。然而,那些質疑智能手機或者iPhone還有Apple的可行性的言論又在哪兒呢?
這些發生在數據中心里的斷電事件隨處可見。那些質疑內部IT部門可行性的言論呢?你上一次斷電時什么時候?你是否質疑過國家電網的可行性?
你可以采取很多措施來應對斷電情況的發生——使用備用發電機(在云環境下,備份數據),但是這些措施并不能解決根本問題。停電是服務商的問題,而不是你的問題。
與其它常見的故障一樣,用戶在決定成功或者失敗的時候扮演著更為積極的角色。以下列舉出一些企業們引進云計算的時候出現的最常見的錯誤。
1. 期望值不切實際
很多公司都視云計算為今天包治百病的良藥。底線存在問題?引進云。難以保證遠程員工的生產性?相信云。是否越來越多的員工在家里工作?也許云可以幫忙。
“制定不切實際的期望值是企業出現云計算問題的頭號原因,”ISACA(國際信息系統審計與控制協會)副主席Robert Stroud說。
“很多企業都認為他們只需要向云供應商提出自己的要求,然后,一切就將像童話故事里一般自己完美地運作。”
如果那是你在家里設置了一個新的應用程序,你還會那樣天真么?如果你沒有制定具體實際的目標,那么,當云計算辜負了你的期望的時候千萬不要感到驚訝。
2. 落后的計算概念
今年年初,Heroku因為亞馬遜EC2的斷電而徹底傻了眼。Heroku為Ruby on Rail提供了亞馬遜托管的云部署平臺。當天氣因素導致斷電,Heroku親眼目睹了它的整個架構伴隨著平臺上四萬多個應用程序在一瞬間灰飛煙滅的過程。
事實上該公司早就為排除故障和冗余做了自己所能想到的一切。但是他們沒有意識到的是,自己把所有的一切都托管給了一個單一的亞馬遜“可用區域”。
事后,亞馬遜與Heroku通力合作,很快就追回了他們的平臺,但是通過這次事故卻可以看出計算理念的落后可能破壞云計算所作出的努力。故障轉移、備份、和信息冗余比較容易在計算世界中進行虛擬化。如果你對現場進行了備份,那么你就能一直保持良好的狀態。
“云計算中的穩定性是復雜的,這是我們吸取的教訓之一,”Heroku的首席執行官Byron Sebastian說,“云架構是一個完整的解決方案,這是一個云計算的謊言。就像任何其它IT系統一樣,在云中你同樣需要附加軟件。”
因此,為了給用戶提供諸如先進的故障轉移、負載平衡和信息冗余等服務,Heroku擴大了自己的平臺,所有的一切都為云托管的應用程序量身定制。
3. 不能堅持讓服務供應商負責
Heroku是幸運的。在他們面對困難的時候,亞馬遜及時向他們伸出了援助之手。其他人可能就沒有這么幸運了。瀏覽一下主要的云計算平臺用戶論壇,你就會發現大量不滿的宣泄。
“某某廠商丟失了我所有的數據但是卻對此置之不理!”像這樣的抱怨不計其數。(這種抱怨的言論后面通常添加了很多感嘆號。)當然其中不乏一些自己把事情搞砸了卻想找人發泄不滿的人,也有一些心理不平衡的瘋子,但是確實有不少合理的抱怨。
有些人屏蔽了關于其他用戶對于服務廠商的抱怨記錄,我與這些人中的很多人談過,但是很少有人會對這些由用戶服務所產生的爭論進行討論。
Novell的商業服務管理解決方案市場部經理Michele Hudnall給我發郵件的時候強調了清晰定義服務水平協議(SLA)的重要性。Hudnall提醒說,必須小心缺乏服務水平協議、模糊定義服務水平協議和那些整體服務管理不佳的情況。
在關鍵業務出現問題的時候,哪怕只是在很短的時間內,企業就可能失去1%到2%的收入。當發生這種情況的時候,堅持要求服務供應商負起責任非常重要。這可能意味著需要就你的合同和服務水平協議中的賠償條款和補救措施進行重新談判。
Gartner最近起草了一份云供應商應該履行的消費者權益清單。其中包括服務水平協議中解決負債、補救措施、業務指標等條款;影響用戶業務流程的服務項目的改變的告知權;了解系統技術限制的權利等等。
4. 你自己未能負起責任
即便你擁有一個具體的服務水平協議,也不意味著在出現問題的時候就可以擺脫困境。舉例來說,如果你在云中存儲了敏感客戶數據,之后這些數據遭到別人的破壞,這將引發什么?難道你真的認為僅僅用服務水平協議就可以解決問題了嗎?誰將為你的客戶負責?
沒錯,必須是你。
本月早些時候一個AT&T的安全漏洞泄露了超過十萬iPad用戶的郵件地址。大多用戶都把矛頭指向了蘋果公司,但其實問題出在AT&T的云服務上。
這只是一個小小的漏洞。畢竟,大多數人的郵箱地址已經被大量的垃圾郵件入侵過很多次。然而,如果泄露的內容是信用卡或者是其它個人信息,蘋果將面臨的問題就不像iPhone 4遇到的天線問題那么微不足道了。
“你永遠不可能擺脫責任,”Stroud說。“云供應商可能是你的信息托管載體,但實際情況是,如果出現任何差錯,名譽掃地的將會是你。”
[page]
5. 缺乏對供應商的仔細調研
幾乎每個服務廠商、托管公司和互聯網服務提供商都標榜自己是“云供應商”。然而,并非所有的云供應商都一模一樣。雖然對谷歌、亞馬遜和IBM下注似乎在近幾年內相當安全,但是你也不能就此認為所有的云計算創始公司都擁有相同的服務水準。
如果你的云供應商出現問題了怎么辦?去年云巨頭Coghead的崩盤讓所有人看到了忽略供應商調查會冒多大的風險。Coghead依靠低廉的價格來拉攏客戶。然后當出現財務問題并且不能籌集更多的風險資本的時候,它做出了這樣的決定,讓客戶們在短短幾周的時間內將其數據撤離該公司的系統。
其實事情可能會更糟。如果你的云供應商在沒有預先通知的情況下直接倒閉了呢?如果發生其他更不好的意外呢?
6. 對于服務供應鏈了解甚少
即便你的云供應商的名譽十分可靠,你是否確信他們提供的服務同樣可靠?云供應商越來越喜歡將自己的服務外包給第三方。了解整個服務供應鏈對于準確判斷你將簽約的服務的可行性十分重要。
如果你正在面對一個大型云供應商,你的手上至少需要有一個他們的把柄,這樣,負面信息可以激勵他們去解決問題。至于較小的廠商,就需要你自己來把握了。
7. 忽視管理和監控應用程序
很多企業都錯誤地認為管理和性能問題將在實現云以后消失。“對于傳統的應用程序,你將花費80%時間和資源在管理和監控上,”Sebastians稱,“云能夠有效地節省這部分時間和資源,但是不能將它們降低為零。”
如果你的應用程序表現不佳,你的客戶將不會責怪云供應商,而會指責你。“你的應用程序里將會出現錯誤,這是不可避免的,”Sebastian說,“有了正確的性能管理和監控工具,你將會在一切成為災難之前擁有更多的機會來發現這些錯誤。”
8. 對財務現實的無知
很多企業引進云是因為它比設置內部IT部門廉價。一般情況確實如此,但是即便是云服務更便宜,企業也應該看到它昂貴的本質。
為什么這么說呢?
“我們對于今天在各種技術上的花費知之甚少,”Stroud說。
這也不完全是你的錯誤。IT系統的財務透視確實是一個棘手的問題。許多經費并不透明。誰消耗了什么?誰支付什么?誰可以消耗多少?對于許多IT部門而言,這些問題的答案可能十分模糊。伴隨著云的發展,這些問題的答案將變得更加不明朗。
9. 不了解云在法律上的繁瑣程度
當你外包計算資源的時候,你的業務即便再小也可能會冒一定的的法律風險。你可能需要遵守不同司法管轄區的法律,你也可能會面臨不同的法律責任,這取決于你的數據到底在哪兒。
據Gartner稱,“服務供應商對于他們將數據存放在哪個司法管轄區和他們的用戶必須遵循的各種法律規定的解釋并不明了。”
遵守行業規范也是件比較麻煩的事情。即使云服務能夠限制風險并且在技術上使你的兼容性更強,你也需要一段艱難的時間來證明這一點。
10. 對云計算本質的誤解
最后,云部署失敗的最大原因是因為企業們并不了解云的本質。許多公司發愁的問題其實并不是他們自己數據中心里存在的問題。斷電、安全漏洞和兼容性問題是全體IT界需要面臨的挑戰,而不單單是云。
事實上云所解決的問題比它制造的問題要多的多。云可以減少你的IT管理和維護麻煩,可以讓你把注意力從IT轉移到核心業務上去。對于云的誤解是一個巨大的錯誤。