近年來,各行各業隨處皆言“大數據”。然而,目前人們關于大數據價值的討論大多仍停留在宏觀層面,如何在大數據環境下挖掘出有價值的信息和規律,需要極大的計算量。盡管通過硬件的提升可以使對數據的計算獲得更快速度,但這樣的平臺同樣需要軟件來支撐。
分布式計算提供了一個解決方案。事實上,云計算就是在分布式計算(更進一步是網格計算)基礎上發展起來的。目前,分布式計算最基礎、最常用的編程軟件非Hadoop莫屬,因此,基于Hadoop開放、可信的數據處理平臺,廣為數據分析用戶所青睞。
Cloudera就是這樣一家Hadoop數據管理軟件與服務提供商。12月10日,成立不到7年就成長為業界翹楚的Cloudera正式宣布,其分公司在中國“開張”。這標志著這家已在全球發展了1300多家客戶的大數據公司,開始將業務觸角伸向對大數據解決方案需求潛力巨大的中國市場。
把高級分析功能平民化
Cloudera中國公司名為肯睿(上海)軟件有限公司,其登陸中國市場將致力于喚醒沉睡在企業大數據中的商業規律,從而幫助企業通過大數據處理和分析加速洞察業務的獲取效率。
今年3月,英特爾宣布再次向Cloudera注資,總投資額增至7.4億美元,持股比例達到18%,成為Cloudera最大的戰略股東。與英特爾公司的合作使得人們對這家初入中國市場的公司有著更高期盼。
Cloudera公司創始人之一、首席執行官兼首席戰略官邁克·奧爾森專程飛臨中國為新公司站臺。《中國科學報》記者近日在Cloudera于北京舉辦的首場媒體見面會上見到他以及Cloudera 全球副總裁、大中國區首任總經理凌琦,深度了解了Cloudera在中國區的戰略部署和大數據解決方案。
“英特爾的硬件和Cloudera大數據的軟件的聯手,會給最終客戶帶來更好的產品。”奧爾森介紹,Cloudera最新發布的5.3版本“百分之百開源和符合開放式標準”,是目前市場上功能最強大、安全的大數據平臺。
凌琦告訴記者,英特爾投資Cloudera之后,將其Hadoop部分的業務和Cloudera的產品合并起來,作為產品團隊的基礎。“Cloudera雖然在中國剛剛落地,但以此為基礎的團隊在過去3年間在大數據、Hadoop領域積累了足夠經驗。”
英特爾方面也給出了回應。英特爾中國研究院院長吳甘沙在相關活動中談及,英特爾與Cloudera雙方將一起推動基于Hadoop的開放、可信的數據處理平臺,推動整個生態環境的基礎創新,“希望把高級的分析功能平民化,邁入主流應用”,目標就是“讓大數據說人話”。
中國需求潛力巨大
成立于2008年的Cloudera現已成為全球最大的基于Hadoop的發行提供商,在全球擁有很多合作伙伴和終端用戶。今年高調入駐中國,Cloudera高層口徑一致,宣稱要和中國的合作伙伴一起“把最好的大數據服務帶進中國”。
“中國擁有巨大的商業潛力,在大數據潮流下,擁有龐大人口的中國勢必擁有巨大的機會,這些機會在全球其他任何地方很難看到。”奧爾森毫不諱言,Cloudera在全球擁有包括電信運營商、金融、零售、制造等各行各業的客戶,這些服務經驗將為“深挖”中國市場提供借鑒,“數據可以方便地導入到數據管理平臺,借助高級分析工具對客戶數據進行深度挖掘,同時還可以建立更多的上層應用,以提供更多商業價值”。
目前中國多地在智慧城市建設方面暗自發力,金融、電信、交通、新藥研發、醫療信息化等領域的大數據管理與分析需求巨大。
Cloudera的中國戰略是“用本地的支持團隊和商業模式服務本地客戶”。凌琦介紹說,目前,Cloudera大中國區在北京、上海、廣州設有分支機構,“肯睿是由中國領導團隊和技術團隊組成的本地公司,可以更好地服務中國客戶和合作伙伴。”
“針對中國的需求進行開發和支持,我們有兩個方向:利用大數據使企業運作成本更低,以及挖掘大數據的價值使企業發展更快。”凌琦認為,盡管過去人們常談大數據,但真正的大數據時代才剛剛開始。
立足平臺 完善生態
Hadoop平臺是Cloudera的業務核心,而“Hadoop之父”、Apache Hadoop社區的發起者和領導者道格·卡汀正是Cloudera公司現任首席架構師。奧爾森對Hadoop平臺充滿信心:“Hadoop平臺安全、可靠、成本低、幾乎可以無限伸縮,所有數據應用都可以在Hadoop平臺上面有很多創新。”
記者了解到,Hadoop的社區環境與10年前的Linux非常類似,是業界主流的操作系統方案?;贖adoop架構,Cloudera為客戶提供了功能強大的管理平臺。經過多年發展,Cloudera免費版在國內市場已經占據80%的份額,并有越來越多用戶轉向收費的商業版本。
面對巨大的中國市場,僅有平臺是不夠的。凌琦表示,大數據是相對復雜的一項技術,它不僅需要在軟硬件平臺、行業系統集成架構及應用上分析和挖掘數據,同時還要注重新應用的開發。“大數據需要生態系統,需要培養人才。”
凌琦介紹說,Cloudera迄今為止在全球已經培訓了近4萬名大數據平臺的管理、應用和開發相關人才,并提供培訓認證。“我們希望通過培訓人才帶動中國大數據實施和運用的快速發展。”
Cloudera希望與合作伙伴、用戶展開相關的人才培訓及認證,同時與大學、研究機構合作,來解決當前大數據人才短缺的難題。
“企業用戶也希望得到我們的培訓,這不光對企業本身的發展,同時對受培訓對象自身的職業發展也有幫助。”凌琦說,Cloudera提供的大數據人才培訓及認證是非常有吸引力的,在美國受過大數據認證培訓之后的技術人員薪水會得到顯著提高。
而與教育機構的合作,凌琦透露,實際上是把材料和培訓方法教授給大學,通過講師培訓更多的學生,讓學生在走出校園的時候具備大數據開發應用的知識和能力。
Cloudera不僅培訓人才,還培訓大數據培訓師,并引入第三方認證。“培訓不僅是為了拓展業務,更重要的是對大數據生態系統的培養。”凌琦說。