在兩會期間,大數據再度成為熱點名詞。央視專題報道中也單獨開辟了“兩會大數據”的欄目來分析民眾對哪些議題更為關注。這說明,信息化手段分析民生數據已經開始被政府和新聞單位認可和采用。在此期間,來自英特爾軟件和服務事業部(SSG)的兩位中國區高層主管與IT媒體同仁見面,就大數據問題展開深入討論。
在英特爾工作19年的何京翔,先后在英特爾信息技術咨詢服務部、英特爾實驗室、英特爾架構事業部和英特爾軟件與服務事業部擔任過各種領導角色,曾見證英特爾X86服務器從0份額到94%市場占有率的奇跡。在英特爾以芯片硬件為主的巨大光環下,他就任的軟件與服務事業部似乎被掩蓋了,但他相信,SSG部門也會從“無名英雄”成長為行業矚目的巨人。
說起英特爾的軟件基因,其實有很多人不知道英特爾在開源社區的所貢獻。據何京翔介紹,在開源社區,英特爾可以稱得上是一家最大的開源軟件公司,是Linux最大的貢獻者之一。在安卓開發上跟谷歌有很多合作;包括現在流行的Hadoop大數據,英特爾是Hadoop社區的一個重要貢獻者;還有云計算方面的Open Stack云平臺管理項目,英特爾也是前十名貢獻者之一。
英特爾的“軟實力”還體現在組織架構上。在全球,英特爾軟件與服務部門共有6000名員工,如果SSG是一個獨立的機構,足以躋身于全球5大軟件公司之列。在中國,SSG有2000名員工,其中60%是軟件工程師。他們分別在北京、上海和深圳各分支機構,其中位于上海的亞太研發中心集中了主要研發能力。工程師們的主要工作,一方面是作為全球的研發網絡的一部分,同時也面向中國市場機會的做本土解決方案。
具體來講,英特爾SSG部門的工作重心主要體現在四方面:第一,優化英特爾平臺,如何體現英特爾平臺的安全性、可靠性、可管理性,如何體現出平臺的優勢;第二,開發英特爾平臺潛能,如何將英特爾平臺在安全上、可管理性和硬件特有的功能發揮出來;第三,通過開源軟件的方式,跟開源軟件生態系統廣泛合作,讓他們把英特爾硬件的特點體現出來;第四,集成端到端的解決方案,通過英特爾軟件、硬件平臺的協同設計,為用戶提供一個良好的解決方案。
此外,英特爾SSG部門除了支持英特爾硬件平臺以為,還有很多獨立開發的軟件產品。其中,Hadoop發行版,Intel Data Center Manager管理軟件,Intel Cluster Studio等等;還有英特爾先后收購的國外知名軟件公司,目前仍在以獨立的身份運作并出售相關軟件產品,如McAfee,Wind River、Apeona、Mashery等公司。
何京翔說,英特爾的“硬實力”無疑將幫助英特爾軟件發揮更大的優勢。從大數據角度來說,數據渠道是“端到端”的概念。在前端,英特爾的PC業務是強項;后端以數據中心為例,目前有90%以上的服務器是基于英特爾架構的,這使得SSG部門開展軟件業務有很好的硬件平臺基礎。
英特爾大數據并不抗拒非IA的數據來源
很多數據并非僅來自英特爾架構的設備,尤其在智能終端設備上,ARM占據絕大多數的份額,那么由這些設備采集的數據是否還在英特爾大數據范圍之內?
何京翔表示,“關于數據采集,英特爾不排除用其他的非IA架構的數據源。包括現在的蘋果,前端是基于ARM的iPhone,但是后端都是IA的架構。對數據源來講,英特爾沒有排他性。”另外他補充道,“如果前端是英特爾架構的設備,后端是英特爾數據中心的服務。他們之間從安全性上講,比其他平臺的體驗更好;可管理性方面更優,這些方面我們是有成功案例的”。
中國大數據軟件技術和應用完全有可能領先全球
英特爾公司數據中心軟件部中國區首席技術官苗凱翔在介紹大數據重要軟件產品Hadoop發行版的由來時,對中國智慧非常有信心。原因是,Hadoop發行版在中國提前7個月先于全球發布并落地應用,完全依賴于在中國的Hadoop開發團隊和中國移動、聯通這樣的客戶需求,催生了Hadoop發行版必須要先于全球在中國發布。
何京翔說:“在大數據時代,我們中國工程的技術人員,絕對不落后于歐美的開發者,從應用上講,甚至中國有領先的機會”。
互聯網公司其實軟硬不離英特爾
眾所周知,互聯網公司在本質上來說就是一個極具創新力的軟件公司,他們除了采購英特爾的硬件產品外,英特爾軟件似乎對其沒有吸引力。在阿里等互聯網公司切入智慧城市的項目,也許還會與英特爾形成一定的競爭關系。
何京翔說,英特爾與互聯網公司的合作方式不同于其他系統集成商。90%以上的互聯網公司使用的硬件都是英特爾架構的。賣硬件給他們,并不表示與軟件毫無關系,他們仍然需要英特爾的軟件部門的幫助。原因是硬件的更新頻率遠高于操作系統,而互聯網公司硬件升級換代一直走在前端,他們需要英特爾的軟件工程師的支持幫助其優化,保證在新硬件上所有應用跑得最佳。谷歌、亞馬遜、百度、阿里巴巴都是合作非常密切的客戶。
關于互聯網公司切入大數據領域,積極參與一些項目。何京翔表示,英特爾樂見其成,并不感到畏懼,并且非常希望互聯網公司能把這些項目最終落在英特爾平臺上。
究竟誰能摸到大數據的金礦?
預計到2020年,全球將出現500億個終端設備,產生40ZB的數據量,世人驚嘆大數據絕對是金礦!事實上,你知道金礦埋在哪兒嗎?目前,認知大數據寶藏是非常困難,對于大數據價值的開發和利用存在很多矛盾。有時,我們知道這些數據有價值,卻苦于沒有方法或技術來挖掘;有時,我們根本就不知道哪些數據能產生哪些價值,就更無從說起開發和利用了。英特爾SSG認為,對于一個問題的定義,然后到架構,再到應用開發,是需要非常資深的數據工程師或者算法師來完成,因此這類職業未來將非常火爆,現在這類人員的能力差別也是很大的。
目前,很多英特爾的合作伙伴都在研究如何讓那些數據活起來,使其互相之間產生關聯,從而得出一個對行業有意義的結論。何京翔表示,挖據大數據價值需要生態鏈和全行業的共同努力,而非一家公司可以做到的。
英特爾認為其生態鏈有三大組成部分:以國有四大銀行及三大運營商為應用典型的終端用戶占據生態鏈的重要一環;系統集成商、應用開發商、解決方案提供商等合作伙伴更“接地氣”,他們是英特爾軟件與服務事業部2014年生態鏈的重中之重;另外,OEM等各硬件組件供應商一直是英特爾生態鏈持續穩定的環節。目前,大數據生態鏈組建處于剛剛起步的狀態,英特爾在挑選合作伙伴時,重點會考慮他們是否有足夠的行業知識,是否有自我創新能力和生存能力。