[導讀]這里我想談一下存儲的革命,為什么會出現這樣一種革命?這樣一種革命的原因在哪里?一些行業做出了怎樣的反應,另外英特爾可以做出什么?
2014年12月2日,由中國軟件行業協會、中國計算機學會、武漢國家光電實驗室和國防科技大學大力支持,DOIT傳媒和存儲在線聯合主辦的中國數據存儲年度盛會—— 2014(第十屆)中國存儲峰會今天在北京盛大開幕。作為中國存儲產業的十年盛會,峰會以“掌控數據經濟·重塑商業價值”為主題,邀請超過1500位學術界頂級學者、產業精英和企業用戶出席,圍繞數據經濟和商業價值兩大話題,從云計算、大數據、軟件定義和閃存等四個技術方面舉行一系列主題演講和圓桌會議。
在上午的主題演講環節,英特爾通訊和存儲基礎設施事業部(CSIG)存儲部門(SD)總經理 Bev Crair女士帶來了題為《英特爾探索存儲革新之道》,以下是演講實錄:
Bev Crair:各位早上好!剛才一直討論數據革命,所以我覺得我的幻燈片都應該修改了。我叫Bev Crair,我是英特爾公司存儲部門的總經理。這里我想談一下存儲的革命。為什么會出現這樣一種革命?這樣一種革命的原因在哪里?一些行業做出了怎樣的反應,另外英特爾可以做出什么?現在世界正在發生變化,剛才的幾位發言人都在談世界發生的變化,你們看到他們所舉的這些例子實際上我也有類似的例子。
第一、信息的爆炸性的增長。IDC說,現在大概全世界有2ZB的數據在互聯網上。到2020年,將會有44ZB的數據。44ZB的數據非常海量。為讓大家更直觀的了解44ZB的數量是多少我舉一個例子:如果在每個人的細胞上面放一個字節,就意味著有44000萬人,是中國人口的1/4,是Facebook用戶量的1/2,所以管理這么多數據,將會是我們面臨的最大的挑戰,也是我們客戶面臨的最大挑戰之一。
第二、數據的復雜性,不僅僅是信息在增長,數據類型不在僅僅是文本,還有視頻、音頻,社交媒體上的一些信息,所以人們對數據的處理方式也要改變,剛才萬先生講商業模式的變化可以把數據進行交換和交易,黎先生也提到怎么樣在學術環境當中分享數據。所以我們處理數據的方式也發生變化,以前傳統的存儲方式也不夠用了。
第三、云模式,不僅僅是云存儲,而且是云服務的提供商。他們的規模特別大,所以現在一些做云服務的公司,他們的規模極其大,數據極其之大。
第四、安全性,不僅僅是加密的問題,而且還有關于確保誰能夠用你的數據,或者這個數據是怎么樣分享的問題。另外,政府是只把這個數據留給自己用,還是給大家一起用。因此,我們看到很多行業,很多企業都在談安全性。
這四個因素推動我們客戶的變化和行業的革新。現在所出現的,是當我們考慮數據的增長,以及管理數據的復雜性,以及人們讓我們用數據做什么的這些事變得越來越復雜。數據在今天的基礎設施當中所占成本不斷的上升,每一個IT人員在數據中心當中需要管理的數據量要比以前高10倍,而且這樣的一種發展方式是不可持續的。所以,我們希望在存儲行業能夠找到一種方法,能夠更容易的管理這些數據。
下面我講我們這個行業現在做什么來幫助客戶。首先,智能存儲。第二、橫向擴展。第三、使用非易失性存儲,第四、軟件定義。
智能存儲服務主要是以軟件提高存儲系統的效率,包括重復數據刪除,實時壓縮,智能分層和所有這些都是方法。存儲行業都使用這些方法來增加存儲系統的效率。另外一個新的就是分析,存儲系統能夠提供分析的能力。分析存儲當中的數據,然后讓新的應用加入,新的模塊來加入。
第二、橫向擴展。以前是單一的系統內部的網絡,這樣一個網絡和系統是縱向擴展越來越多,但是這種模式無法持續,特別是在云環境下,因為這種模式不能夠占用非常大的模塊,我們需要橫向擴展,而且需要產生規模經濟的優勢,而且更加廉價,更小的系統,而不是把系統做的非常大。
第三、使用非易失性存儲。我們看到,構造傳統硬盤如果實現1100萬的每秒的輸入和輸出需要500英尺高,如果使用3D固態硬盤,它所需要的面積僅為4英寸。所以,大家可以想象一下,我們要建一個新的數據中心,而且現在數據越來越多,它的速度還是加速三倍,所以這樣的優勢和劣勢可以清楚的看出來,這是我們行業的應對方法。
第四、就是大規模,非常復雜的軟件定義存儲。我們開始從硬件到軟件的提出出色的靈活性和可擴展性,而且能夠整合多種提供給供應商的解決方案,比如來自于惠普、來自于華為,在同樣的一個軟件,一個數據當中如何共同來生存,動態提供資源,也就是說,漸進擴展,就是增長一部分付一部分的費用,按需購買,從小開始建,建的越來越大,而且還可以通過協調多種系統實現無限的訪問。
英特爾的貢獻。
講英特爾肯定要講我們的處理器,我們的核心技術就是現代化的存儲系統,核心就是處理器。我們加速處理能力,減少對于能源和電力的消耗。其中一個大家可能不知道,英特爾在存儲部門也有一個存儲相關的CPU,也就是我們在CPU當中有一些非常具體的標準,特別是關于存儲所用的核心。比如說英特爾平臺存儲擴展,能夠使英特爾存儲加速。除了我們的一些平臺和CPU,我們還提供加速庫和DPDK。加速庫非常有意思,我們通過非常典型的軟件的優化,在這個存儲環境當中,比如你有一個軟件是數據的去重復化。每一個CPU將整個流程走一遍,發現用什么方法來加速一些算法,或者一些代碼,或者組合代碼,這些都是免費提供給客戶的,讓刪除重復可以加速。我們有一系列的加速庫幫助你們的軟件加速,這些都是現在英特爾提供的。
另外,DPDK就是用于加密的,而且我們有相關的軟件,如果使用我們的一些技術,我們可以使用硬件的加速你的存儲系統,能夠更快的分析,這就是存儲系統的關鍵。
我想提醒大家的是現在總體擁有成本的變化。如果你使用固態硬盤而不是傳統硬盤,在我們朝著更多以數據為基礎的經濟的發展過程當中,需要越來越多的數據需要離基礎設施和網絡越來越近,固態硬盤是我們未來可以預見的解決方案。隨著固態硬盤速度越來越快,網絡技術也需要發生相關的變化支持這樣快的速度,而且需要有很多工作來支持面向存儲的以太網,以及直接用于CPU的網絡技術。
最后我們做了很多工作加速向軟件定義存儲的轉型,我們研究OpenStack,我們也做存儲的優化,而且還推動其他的無縫通訊接口的標準,我們也在推動這些標準的建設。這種無縫的通信接口的標準以及無縫的數據接口。因為我們相信標準不僅僅是讓我們分享數據,而且我們也做很多工作,加速軟件定義存儲。
所有的加在一起,我們認為作為英特爾的存儲資產是什么?大家可以看到,網絡與架構,SSD,還有存儲技術。我們在這里所做的工作,是希望能夠為生態系統中的合作伙伴和最終用戶提供一些參考,看看我們的架構可以幫助客戶看到他們的問題是什么,幫他們解決問題。
舉個例子,我們剛剛和新浪網做的項目,新浪面臨的問題就是他們基本的商業模式是基于微博的。在微博上面,我們發微博,供大家閱讀、訪問,一段時間后沒有人再讀這條微博,這個微博就存儲下來了,不能夠刪除,需要把它存儲下來。所以,新浪現在所看到的就是他們的這些存儲每年的增長是40%,這種數據模式增長是不可持續的,因為它的服務器還有存儲能力需要不斷的上升,怎么幫助我們使這個存儲更加有效,我們共同做的項目將幫助他們將消費的模式進行了變化,而且將數據壓縮也進行了變化,而且還有刪除重復數據等等,而且改善了他們服務器的功耗,而且增加了他們70%的存儲能力,功耗降低了40%。
大家想想,每年40%的數據增長,而且現在的能力是70%,也就是你的你的數據中心兩年的增長,都不需要再買另外一個數據中心,這能夠幫助新浪長期、可持續的發展。
另外我們跟奇虎360做的Hadoop,他們的挑戰是Hadoop的性能,我們和他們合作,用我們的智能加速庫來減少復制數據所需的時間,而且我們發現他們還需要再增加他們的這些編碼和解碼的加速,我也幫助他們提高相關的效率,就是他們的編碼提升了45倍。這些項目的白皮書在網絡上都有,而且還可以和我們交流我們是怎么做的,上面有很多信息。
總結一下,存儲在計算機行業呈爆炸式速度上升,復雜性越來越高,而且對于IT的需求也不斷變化。行業本身對它的響應,新的功能,新的技術促使行業加速變革。英特爾的產品能夠為實現行業的變革提供基礎。所以,大家可以和很多英特爾的團隊合作,利用新的時代所帶來的機會,非常感謝大家!