第六屆中國云計算大會于2014年5月20-23日在北京國家會議中心拉開帷幕。本次大會立足實踐,以國際化的視野,幫助與會者了解全球云計算技術的發展趨勢;從應用出發,探討交通、醫療、教育、金融、制造、數字娛樂等行業領域的實踐經驗;并通過技術專場、產品發布和培訓課程等方式,深度剖析云計算大數據的核心技術。
在第六屆中國云計算大會全體會議下午的議程中,英特爾亞太研發有限公司總經理、軟件與服務事業部中國區總經理何京翔帶來演講“為云計算和大數據重塑數據中心”。回顧數據中心的演變過程,從以計算機為中心,專注于通過自動化提高生產率,到以網絡為中心,專注于通過連接降低成本,發展到目前已經以人為中心,專注于通過云和相關設備提供快速服務。何京翔認為數據中心已迎來轉折點,英特爾提出SDI的概念,幾分鐘即可提供全新服務。大數據方面,英特爾與Cloudera強強聯手,力爭為Hadoop提供最佳硬件平臺。
以下為現場實錄:
何京翔:各位業界的朋友們,各位專家、各位領導,大家下午好!非常高興又回到了中國云計算大會,這是我第三次來,一共六屆,我參加了三屆。我覺得每次來都有新的體會,特別是今天,我們能夠跟百度、阿里和騰訊的朋友在一個舞臺上共同來為大家講述大數據、云計算的未來,我覺得本身就是一個榮譽,因為我們在中國有百度、騰訊、阿里這樣的公司,真正體會到我們在這一輪的云計算、大數據的技術創新之中,中國真正站在了世界的前列。
講到大數據、云計算,來到云計算大會,可能有人要問,作為業界的領頭羊,英特爾在數據中心方面有這么大的市場份額,那么我們在云計算和大數據方面有什么樣的舉措呢?下面30分鐘我想就這個問題跟大家來闡述一下在云計算和大數據的時代,特別是剛才梅院士也講了,在軟件定義時代,英特爾作為數據中心這樣一個領頭企業,我們在軟件定義這個基礎架構,我們在大數據方面有些什么樣的舉措。
首先,我們的創新都是基于市場,基于實際的市場應用和對未來的展望。我們在過去十幾年通過互聯網,特別是近幾年通過移動互聯,我們看到比如說像智能城市這樣的應用在中國是風起云涌,很多省都在部署智能城市。移動互聯也是一樣,在座的很多人都是移動互聯的消費者,我們通過自己的手機、移動設備、筆記本電腦,甚至有些穿戴設備都在不停地產生著數據,我們也在消費很多數據產生的服務。所以說,這些新的數據和通過數據分析產生的服務都是怎么產生的呢?都是由后臺數據中心產生的,這就對數據中心提出了更高的要求。這是一方面。
另一方面,現在我們都講物聯網,它超出了互聯網和移動互聯,人人和人機交互的范圍,這是機器與機器交互,無論規模和數量上都遠遠大于互聯網和移動互聯。未來幾年里頭,有將近500億的設備會通過網絡連起來,互相交互數據。產生的數據是350萬億,這是一個海量的數據,也就是說通過移動互聯網加上互聯網、物聯網產生了海量的數據,海量的數據呼喚著海量的數據處理,海量的數據處理要求新的數據中心的架構。
英特爾亞太研發有限公司總經理 何京翔
大家在這個行業里都做了很多年了,我自己在IT行業做了30年,我們都知道,IT行業是一個不斷更新的行業,我們這30年里頭一直在不斷的更新,不斷的否定過去,創造新的未來。我們可以回顧一下我們數據中心演進的過程,最早的時候瞄準計算數據中心,目標是提高我們的計算能力,后來發展到以網絡為中心,目標是為了提高我們的效率。但隨著移動互聯,特別是剛才講的,我們是嵌入式的計算環境之中,計算無所不在,計算是圍繞著人的,以前我們最早的時候,我們要把自己的數據到專門的機房上機,人要圍著計算機轉,現在是計算機圍著人轉,最后新的模式就是要以人為中心,以人為本的計算模式,這是我們現在所面臨的。
在計算中心方面,我們英特爾過去15年里頭走過了幾個大的轉折點,大家可以看到,從這個圖的最上面,在2000年左右的時候,我們當時看到了數據中心的快速增長,看到了大家對這些數據中心快速增長過程中對通用服務器的要求,同時我們看到了軟件,特別是開源軟件對服務器和數據中心應用的一些新的趨勢,我們大量投資在開源軟件、開源操作系統上。同時由于我們的努力,可以看到我們基于X86架構的服務器,現在已經占據世界所有服務器市場份額的90%以上,而且大規模的軟件應用是基于開源的,這是我們通過軟件投資來帶動硬件市場轉變的一個案例。
當然,在2005年的時候,大家知道,虛擬化是現在云計算的基礎,虛擬化發生的時候,我們又一次選擇了這個機會,然后在這方面做了很多的軟件投入,使得我們到去年,在數據中心里面采用虛擬化技術的份額達到60%左右,這又是一個轉折點。
我們現在看到的是什么呢?云計算和大數據。云計算我們2010年的時候就開始,可以看到有很多的關于IaaS、關于PaaS和SaaS這方面的投資和應用,我們可以看到這個在不斷的增長。但是,現在云計算數據中心的要求是不是夠了呢?是不是所有的數據中心都能夠滿足像我們百度一樣,能達到90%的份額呢?其實還不是,我一會兒會講到我們面臨的挑戰。
對大數據更是這樣,我們現在還是大數據初始階段,就是說是在嬰兒時期,我們還有很多技術方面,關于怎么樣能夠提供更優秀的最好的大數據方面,我們還有很多技術沒有解決,所以這是我們今天怎么看大數據和數據中心的要求。
創新是需要勇氣的,是需要面對現實的,來看一下我們今天所處的是什么樣的狀況。我這里舉的例子當然不是百度、騰訊、阿里巴巴(滾動資訊)這樣先進的網絡計算公司,是一些標準的傳統企業的數據中心所處的狀況。比如說現在一個傳統企業的數據中心,它的網絡是什么樣的狀況呢?大概需要兩三周的時間來實現一個網絡的更新。然后我們現在的存儲很多都是靜態的,但是,我們數據的增長量是非常大的,往往會遇到我們存儲的設備同數據增長之間不匹配,我們的計算大多數服務器使用率還在50%以下,當做到50%,祝賀你們,真的不容易,大部分還在50%以下。所以說,我們現有數據中心的架構和現有數據中心的現狀是不能夠滿足于我們現在以人為本的大規模的數據計算和服務的要求,是不夠動態、是不能夠滿足我們現在這樣一個數據海量增長以及不同計算模式和應用層出不窮發生的這樣一個現實的。
回到我剛才說的,知道差距在哪,就要針對差距做一些根本性的變革。這就是我們英特爾和業界其他同行一塊提出來的,關于軟件定義的基礎架構這樣一個理念。它的理念是什么呢?就是說我們怎么樣通過我們的技術手段,通過我們的軟硬結合的這樣一個優勢,把我們數據中心過去從一個設計到推廣數據中心的實施,過去是要幾個星期甚至幾個月才能完成的工作,我們把它變成幾個小時、幾分鐘來完成這個工作,這就是剛才梅教授講的軟件定義的一個鑰匙。
所以,我們這個軟件定義有幾個重要的特征,也就是說數據中心今天我們有很多是手工的過程,把它自動化,有些設計是靜態的,把它動態化,一些設備和服務以前是獨享的,把它變成共享,也就是變成資源池。所以,這三方面是我們SDI很重要的一個主旨。
具體怎么做?當然這個概念,大家覺得我們是做云計算的,這是我們云計算要做的事情。但是具體怎么做,這里面英特爾有很多功課可以做,有很多東西可以跟大家分享。就像剛才梅教授講的,有些東西,比如說硬件的顆粒物怎么湊API,怎么使得這個硬件設備用軟件定義來管理。
比如說一個簡單的例子,服務器基礎設施轉變,這就是我們SDI的基礎,通過服務器基礎設施轉變,能夠降低利用率。怎么能夠把我們在服務方面的工作應用到網絡和存儲中去,使得我們有SDN和SDS,這是我們下面要做的事情。存儲方面,我們現在很多數據中心的存儲基本上是一個存儲服務器加上一個接口,在未來我們可以提供軟件可管理的,能夠實現自動的冷數據、熱數據的分層,能夠減少數據的重復量,同時,再下一步提供這樣的云接口,使得存儲是基于你的管理模式自動的進行調整。所以說,通過SDI,我們可以從計算、存儲和網絡三個方面都實現軟件定義的提供一定的顆粒化管理的接口,這樣實現對英特爾硬件最好的網絡、存儲與計算管理。
當然,剛才我們講過,這是一個業界的共識,包括VMware,包括HP、包括IBM、華為,這也是我們業界一起,眾人拾柴火焰高,往這個方向去努力的基礎。也就是剛才梅院士講的軟件定義的基礎架構,軟件定義的數據中心,軟件定義的服務即將變成我們云計算和大數據計算數據中心的基礎。
談到了大數據,在剛才我們做軟件定義基礎架構的基礎上,我們對大數據有了自己非常獨特的研究。在這里跟大家匯報一下,英特爾大數據的創新很多是基于中國的,我們主要的研發團隊是在上海,所以這也是我們非常自豪的跟大家分享了一點。這方面我們在中國其實是有很多領先和先發的優勢,比如說在運行效率的優化程度,我們已經和中國的國康、海康合作,提供智能城市、智能交通服務。在消費方面,我們和阿里支付寶有很多方面的合作,大家在用淘寶的時候,很多后臺的服務優化其實就是英特爾中國團隊跟阿里合作,來幫助阿里大數據在英特爾后臺上跑得更快。在安全上,我們提供了大數據服務的引擎在里面,然后提供我們進一步的安全管理。
正因為我們在大數據方面,特別是在中國的應用上有這么多的斬獲,所以,大數據變成了英特爾數據中心部門三個重要的方面,一個是高性能計算,第二是云計算,第三是大數據,所以大數據是英特爾數據中心部門的一個主要的核心部門。基于它非常重要,所以,大概3月份的時候,英特爾做了一個非常重要的戰略投資,把Cloudera 18%的股份買過來,我們投資7.4億,當時我們做這個戰略投資時,有很多媒體的報道,5月初我們專門在中國上海和北京做了兩次英特爾和Cloudera合作的媒體發布會,這個合作其實對中國市場來說是非常重要的。第一,英特爾有這么大的投資,正是意味著我們對大數據非常重視,當時有些媒體在3月底的時候說,是不是意味著英特爾不做Hadoop,就要退出大數據了?其實不是這樣的,哪有投資7億多美金,然后退出這個市場的道理。我們做的恰恰相反,要加大在這方面進行努力,通過培育更強健的生態系統和業界領先伙伴把這方面做得更大更強。
對于我們第二點要提到的,我們原來有英特爾的Hadoop發行版,現在是不是消失了呢?其實不是,因為現在的Hadoop發行版將融入到我們Cloudera發行版里面去,這意味著什么呢?這意味著我們現有的用戶將得到更好的支持,未來的用戶將得到增強版的CDS的支持,使得他更好的融入我們的發行版里面去。
第三,英特爾做這么大的投資目的是為了讓我們未來的大數據平臺在英特爾平臺上跑得最好,我們為大數據的應用提供最好的平臺,而不是要使得大數據在這個里面變成一個更好的部分,我們要變成更大的部分。
基于前面這三點,我們利用在安全和平臺優化上的優勢把它進入到Cloudera里面去,真正可以體會到1+1大于2的效果。對Cloudera來講,大家知道它現在是全球第一的發行版,它的創始人也是Hadoop的創始人,所以說在業界的影響非常火,他有1000多個數據合作伙伴,通過我們的合作,我們把Cloudera帶到中國來,使得我們形成強強聯手,聚焦中國,領航大數據的局面。
剛才我講到了,英特爾有的不光是Hadoop這一個方面,我們的長處是在整個平臺構建一個大數據平臺。首先從系統優化上講,我們有硬件的安全加密技術,有壓縮技術。第二點,我們的存儲技術上也是有我們的優勢,我們可以比常規的存儲要快20—30倍。再有,我們現在跟中國業界的伙伴合作,我們在機架集成上有自己的獨到之處,可以把整個系統優化的機架變成一個大數據處理平臺,提供一個優化平臺,從而使得我們對大數據處理有一個質的飛躍。
剛才講到大數據平臺,大家可以看到大數據平臺不是一個公司就能做完的,比如說下面有存儲、網絡和分析,中間有一個大數據平臺,它相當于大數據的操作系統,在上面有分析工具和行業應用,這些東西全加起來才是一個真正的大數據解決方案平臺。大家可以想象,這不是任何一家公司可以做完的,是需要行業界的合作,是需要眾人拾柴火焰高的努力來完成的。所以,我們現在要做的投資,跟Cloudera的合作,以及跟其他廠商的合作,就是要共同構建這樣一個大數據平臺,使得我們在這個平臺上,大家都能分一杯羹,這也是英特爾比較傳統的一個模式,就是英特爾本身不是一個一家通吃的公司,我們希望構建這么一個平臺,大家把餅做大,使得我們都能夠獲益。