9月16-18日,由UBM主辦的2014全球云計算大會在上海國際會議中心舉行。這是大會繼2013年首次亮相中國后的第二次亮相,大會通過會議與展覽相結(jié)合的運作模式,為參與者提供全方位、多維度的云計算解決方案。
國內(nèi)領(lǐng)先的企業(yè)級云存儲服務(wù)商七牛云存儲應(yīng)邀出席,七牛總裁呂桂華在企業(yè)云架構(gòu)專場進行了《云時代的企業(yè)數(shù)據(jù)管理策略》分享。分享結(jié)束后,呂桂華就七牛相關(guān)問題回答了現(xiàn)場記者和嘉賓的提問。
問:剛剛您提到了七牛的產(chǎn)品,類似于亞馬遜的S3,那其實我一直對七牛這個產(chǎn)品有疑問,亞馬遜的S3,跟其他產(chǎn)品比如云主機是一起的。但是七牛是提供對象存儲,不知道這個問題您是怎么看的?
呂總:為什么我們不認為云主機是很關(guān)鍵的,我們分析了一下,不同的數(shù)據(jù)之間什么情況下需要流通。您剛剛提到的,云主機跟我們現(xiàn)在的存儲系統(tǒng)之間,它什么時候會需要發(fā)生數(shù)據(jù)流量,這個是我們真正在關(guān)注的。我們其實現(xiàn)在劃分,就是所有的云服務(wù)器,就分成我剛剛說的三類管理系統(tǒng)。云主機主要是圍繞數(shù)據(jù)庫的計算,所以它跟數(shù)據(jù)庫待在一起。因為它跟數(shù)據(jù)庫之間的對話會非常的頻繁,必須是在局域網(wǎng)里面進行。但是云主機跟我們的非結(jié)構(gòu)化數(shù)據(jù),到底是否必須在一起呢?這個不一定。這個要看它有幾種場景,因為我們構(gòu)建的是一個非常完整的非結(jié)構(gòu)化數(shù)據(jù)的管理周期,就是它從一開始,最終用戶上傳的時候,就是直接上傳到我們這邊的。然后處理也好,存儲也好,分析也好,下載也好,全是走我們這邊的。然后它跟云主機之間肯定還有通訊,這個通訊的話,我們現(xiàn)在的通過跟我們大量的客戶的,他們到底怎么用我們,這個用法是千奇百怪都有,但是通常產(chǎn)生的數(shù)據(jù)交流是源數(shù)據(jù),就是比較常規(guī)的用法就是一個用戶,我們的客戶產(chǎn)品的某個用戶,他上傳數(shù)據(jù)之后,上傳完整了之后,我們會通知云主機,告訴它某一個文件名為什么的文件上傳完成了,只是這樣一句話,因為這句話數(shù)據(jù)量只有幾個字節(jié),跨局域網(wǎng)也好,跨公網(wǎng)也好,它的影響很小,因為現(xiàn)在的話,機房跟機房之間的延遲,已經(jīng)能做到只有幾十毫秒,跟局域網(wǎng)只差幾十毫秒,是可被接受的。當然最好我們也有云主機,但是我剛剛講了這個邏輯,我們認為云主機不太關(guān)鍵,在合適的時候,我們會考慮。
問:七牛說能達到16個9,是可靠性還是持久性,這16個9的含義是什么?
呂總: 16個9其實是學術(shù)概念,是概率論的問題。就是多少個9,在可用性和可靠性上它的解釋是不一樣的。通常的云服務(wù)它通常有兩個指標,一個是數(shù)據(jù)可靠性,一個是服務(wù)可用性,服務(wù)可用性就是你這個服務(wù)出錯的概率是多少。然后服務(wù)出錯,因為它有多種原因,一個是服務(wù)壓力太大,也會出錯。因為壓力太大的時候,你訪問過去,可能會返回50幾,這個50幾,是認為錯誤的一種狀態(tài)。所以可用性,所以它通常不會非常多的9。最多99.99%,亞馬遜能承擔的,它寫的可用性是99.9%,只有三個9。但是可靠性有很高。可靠性是說你當前的技術(shù)架構(gòu)、運營機構(gòu)下,它包括了兩個,技術(shù)架構(gòu)就是你的技術(shù)設(shè)備怎么樣的,這兩個結(jié)構(gòu)下,所達到的數(shù)據(jù)丟失的概率是什么樣的。我就拿個簡單的作為比方,如果你數(shù)據(jù)沒有備份,存在一塊硬盤上,這塊硬盤壽命是五年。那你丟失數(shù)據(jù)的概率就是五年,這個五年可以轉(zhuǎn)成多少個9,這個是個數(shù)學問題,這里不講了。然后你存在十硬盤上,每塊硬盤的壽命是五年,每一塊都可能在五年之內(nèi)任意損壞,你損壞的概率就變成半年,因為五年的1/10,這個是概率論的問題,當年有成千論萬塊硬盤,就變成你每天每秒鐘都可能有一塊硬盤損壞,所以在這種情況下,怎么樣假設(shè)讓硬盤必然損壞的情況下,數(shù)據(jù)還不丟,這個是我們的邏輯,大致上算法是公開的。多少個9的算法是公開的。你感興趣的話,可以做一些針對性的搜索,就能找到。
問:一個您剛剛說到的數(shù)據(jù)上傳,這表示客戶手工上傳,還是有一些自動可以抓取數(shù)據(jù)。因為有很多數(shù)據(jù),手工上傳不太可能,有沒有工具可以上傳?
呂總:這個跟我們跟客戶之間的合作模式有關(guān)系。我們現(xiàn)在很自然的,作為個人用戶,會發(fā)現(xiàn)網(wǎng)盤有自動上傳的能力,就是你在PC上裝了一個,像國內(nèi)的金山快盤,它會自動的幫你設(shè)置的文件夾里面,把文件上傳,在我們看來,這個是一個APP的能力,我們不需要提供的,因為這個不是共性的需求,有一些需要自動上傳,有一些不需要自動上傳。所以我們要提供一個共有的需求,就是上傳。但是這個可能涉及到另外一塊,就是數(shù)據(jù)遷移,數(shù)據(jù)的遷移我剛才提到說,我們可以提供軟件,這個軟件的話,當你數(shù)據(jù)量在一定程度之內(nèi),是可以用軟件來跑的,我們跑一下我們的軟件,把這個軟件對應(yīng)的文件夾里面所有的數(shù)據(jù)全部遷移到平臺里面。但是數(shù)據(jù)量太大,跑幾個月還沒有跑完,這個就不現(xiàn)實了。我們提供的辦法是寄硬盤,聽起來很土,但是很實用。
問:數(shù)據(jù)上傳有沒有加密?
呂總:我們在云端缺省狀態(tài)下,數(shù)據(jù)是不加密的,這個跟客戶的需求有很密切的關(guān)系,我們主要做的事情是數(shù)據(jù)的分塊,分塊跟打亂,這個有一定性的安全性的效果,但是不能認為是加密。只要做云存儲的,肯定都不是做加密的。因為加密它本身也是一個應(yīng)用層的需求,因為加密它一個非常大規(guī)模的計算,密度是很高的計算。有一些網(wǎng)盤,比如說我知道的,我們這個大塊是有一個書生云存儲,它的賣點是安全。它可以在數(shù)據(jù)上傳之前,就在客戶端做好加密,然后上傳,這樣即使網(wǎng)絡(luò)傳輸?shù)闹型颈唤厝。矡o法理解你這個文件的內(nèi)容。如果我們這一端加密了,傳輸過程中還是不安全的。就是它還得解決傳輸中的安全問題。對于我們來說只是一個服務(wù)的問題,我們可以在真正存儲之前,先加密,但是這個先加密在我們來看就是處理地過程。另外一個是保證傳輸過程當中的安全性。
[page]
問:貴公司為什么叫七牛信息,是不是數(shù)據(jù)太大,需要七匹牛來拉?
呂總:七匹牛能拉動的數(shù)據(jù)不是很多,我們還要大一些,至少八匹牛拉才行。這個名字是我起的,所謂名字是什么意思,因為起名字是很復雜的一件事情。起名字關(guān)鍵就是要讓大家能記住。能夠被人問你為什么叫這個名字,就成功了,大家就能記住你這個名字了。
我另外一個聯(lián)合創(chuàng)始人回答過這個問題。其實我的回答才是官方的,因為我起的名字。整體回答就是我們試圖回答一個理念,就是做服務(wù)是一個穩(wěn)的東西,牛是一個很穩(wěn)的形象。除了發(fā)瘋的牛,正常情況下的牛是很穩(wěn)的很可靠的,這也是我們在內(nèi)部反復強調(diào)的企業(yè)文化叫簡單可信賴。我在做內(nèi)部企業(yè)文化培訓的時候,我用了一個形象,不是牛,因為牛實在太直白了。我問大家,所謂的簡單可信賴,它真正的展現(xiàn)是什么樣子的。我當時給了一個形象,就是一個三角,三角其實就是現(xiàn)有的三角板的結(jié)構(gòu)。三角是現(xiàn)在建筑結(jié)構(gòu)里面最常見的一個結(jié)構(gòu),它簡單,但是從不出問題,這個其實是我們反復去強調(diào)的一個理念,就是你一定要做得足夠簡單,才是可信賴的。這個簡單的話,就是第一步我們的組織要足夠的純粹,不是很少的人,而是100個人,盡可能要看起來像一個人,之間的溝通成本要夠低。大家有事說事,有問題提問題,該罵就罵,千萬別帶著面具說話。這個是我們非常重視的企業(yè)問題。我相信很多人感興趣這樣的企業(yè)文化,感興趣的話,可以看看我們有沒有適合你的工作。