每當提到云數據存儲算法,IT專家們總是先聯想到云存儲中的數據災害修復,數據歸檔和數據備份,而不會考慮到云主存儲器或非直接存儲器。那么問題是:為什么出現這種現象呢?
為解開上述疑慮,IT行業記者特別邀請了業內大師Arun Taneja,他是Taneja集團的創立者兼咨詢分析師。記者與Taneja面對面談論了滯后性問題,滯后性也是原始數據未能在云環境中實現的主要瓶頸。Taneja解釋了日新月異的新興技術如直接插入數據的數據復制和數據壓縮如何推動云存儲基礎數據設想的行成,描繪了云存儲方法的先天優勢,同時闡明了為何云存儲方法會成為影響云基礎數據存儲主要因素。
記者:多數存儲專家認為云存儲主要就設計數據災難恢復和數據備份,而不是主存儲,為什么呢?
Taneja:首先讓我們看一下什么是主存儲器以及如何界定主存儲。主存儲器是與各種運用程序直接連接的存儲。也就是說無論是SharePoint還是Exchange還是企業應用程序都會直接影響數據。應用程序與數據是動態變化的,創建新數據,修改數據,輸出數據,所有操作都是直接關聯的。大多數用戶在這點上對云沒有足夠的信心,認為云沒有足夠能力及時處理這些這數據,這是第一點原因。
第二點原因同樣重要,就是除非數據中心恰巧在你周邊,否則存儲數據時都存在滯后性問題。指令從一個數據存儲中心到達另一個存儲中心再返回都需要一定時間。而這段時間對主存儲器應用程序來說是過長以至于不可接受的。這也是為什么通過云傳輸的應用程序都是二級應用程序或者次級數據,比如說數據備份和歸檔。
記者:當然,云存儲是正在蓬勃興起的新興科技。那么為了非直接存儲數據在云環境中生存,人類都做了哪些技術改進呢?
Taneja:我斷定某些技術在存儲方面已有所改善,存儲與云作為整體聯系加強,從云角度考量這種技術也有所改善。先來看一例存儲方面的提高。
一些新興技術如內聯數據復制,內聯數據壓縮,快閃,以及WAN優化設計:這些都是存儲方面相關的技術提高。
云方面也具備了一系列新技術。如生成一些云案例,雖然在地理位置上天南地北,但是對于應用程序而言宛如一個云。
只要把我提出的所有新技術聯系在一起,我們就有可能將云作為主存儲器了。
播客第二部分:Arun Taneja探討了云環境文件傳輸的運用,為什么在云算法下如此重要,他也鋪陳了聽眾們將來可以享用的非直接數據存儲的服務等級。
記者:云環境中實現主存儲功能,云網關又扮演了什么角色呢?與傳統的主數據存儲又有什么區別呢?
Taneja:想要將云作為主存儲器,云存儲網關是必須的。很多年前,很多投資商想要拋開網關實現云主存儲功能。應用程序可以通過WAN直接撥打NFS直接連接到云,并將云作為主要NFS存儲。然而過程中產生的滯后性使運用程序直接無響應。無論投資商如何千方百計尋找門路回避網關都無法成功。沒有網關的云主存儲就像沒有CPU的計算機,永遠不可能達到其功能。
那又有問題了:云網關怎么做才能使云主存儲像正常主存儲器那樣影響應用程序呢?
目前為止行業內做得最好的是StorSimple。StorSimple有配套數據中心設置的網關,對于應用,這個網關像iSCSI 標的;對于云,他可以使用網絡類型的語言,也就是云能讀懂的語言進行數據傳達。這里的云可以是Amazon, Nirvanix, Rackspace或者市場上任何公共云。網關可以實現內聯數據復制,數據壓縮,快速照相然后上傳到云環境中。網關也具備緩沖能力,網關內配置了固態硬盤和硬盤驅動。每個用戶都擁有1到2個網關從云中有效提取數據,并及時傳輸到應用程序中,在緩存區中保存最新數據。這種網關的方式非常實用,解決了一旦沒有很好處理就會產生滯后性的云主數據存儲問題。
最終,云存儲網關將消除滯后性的影響,使云存儲真正實現異地本地操作同步,數個操作同步。那是網關的魔力體現,也是實現云主存儲的先決條件。