百度外賣為什么比其他平臺送的快?當然不是因為它的騎手比別人跑的快,而是由于背后有一套智能的算法,能更加合理地派單、規劃送餐路線。
這屬于大數據的范疇嗎?屬于。
電商平臺的商品推薦系統為什么能推薦給你感興趣的東西?也是因為掌握了你的數據,并據此分析你的生活、工作習慣。
這屬于大數據的范疇嗎?屬于。
顯然,透過數據分析,作為消費者,我們能體會到大數據給我們生活帶來的變化(更快地吃到美食,買到自己感興趣的東西);作為商家,則能更好地服務客戶,發掘商業價值(提升客戶體驗,獲得更高的業務成長)。
這也是為什么大數據這么火的主要原因,三贏,除了客戶、企業,還有大數據解決方案的提供商。
但這和英特爾有什么關系嗎?
論應用,像百度、阿里、京東,他們這些最終用戶在做,論平臺軟件解決方案,Hadoop、Spark這些開源社區、解決方案提供商在做,論硬件解決方案,浪潮、聯想、華為、HPE等基礎架構解決方案提供商在做。
答案是有,而且關系還很大。
2你聽說過不打地基直接蓋房子嗎?反正我沒有。
廣大硬件解決方案提供商如果說是房子,那英特爾就是地基。Intel Inside的slogan不僅適用于PC領域,同時適用于數據中心市場。不完全統計,世界上有90%以上的中小型計算機采用的是英特爾的處理器,也就是說絕大多數的數據都是通過英特爾的處理器來處理的。
你還能說大數據和它沒關系嗎?地基和房子共同組成了處理數據的硬件平臺。
當然,英特爾在大數據領域扮演的一個角色。另外,你見過裝修房子前不測量的嗎?我沒有。
如果平臺軟件解決方案提供商是裝修的話,那英特爾所擔負的正是測量那個環節。不測量,裝修無法做到精準,結果就是費時費力費錢。英特爾是世界上最大的硬件公司不假,但同樣英特爾也有著世界上最大的軟件研發團隊。據悉,它的規模超過萬人,而硬件與平臺軟件解決方案之間的優化、適配就是很重要的一項工作。站在這個角度看,大數據只能是其中的一個分支。
同樣的,應用軟件與硬件之間的關系,就像是家具家電和房子的關系,在購買之前也需要測量尺寸。
也就是說,英特爾作為最底層的平臺,無論是與平臺軟件還是應用軟件都有不可分割的關系。其之所以有那么大的軟件研發團隊,原因不明而喻。
于是,我們看到了這樣一個英特爾,大而全。
硬件層面,不僅是處理器,還有存儲、網絡,英特爾都做,而且都做的不錯。
軟件層面,除了發揮測量功能,對很多項目,包括大數據項目,除了進行優化外,還會主動推出一些開源項目,比如大數據領域,英特爾最近推出了TAP(Trusted Analytics Platform,一個云應用程序的加速工具)。
給合作伙伴、用戶的錯覺是英特爾軟硬件都要做,而且越做越廣。事實上并非如此,英特爾的核心業務還是在硬件,軟件方面的投入更多還是在服務硬件,讓用戶有更好的硬件體驗。而為了離用戶更近(英特爾并不直接對接用戶),英特爾與很多業內的軟件服務商都達成了合作,比如與Hadoop解決方案提供商Cloudera的合作。
Hadoop創始人,Cloudera首席架構師Doug Cutting介紹他們在數據分析領域的探索,以及與英特爾之間的合作
至于硬件,確實英特爾涉及的領域在不斷擴展,這一點英特爾自己也承認。不過聽聽英特爾公司軟件與服務事業部副總裁、系統技術和優化部門大數據技術總監馬子雅的解釋,或許你會釋然。
馬子雅表示,確實任何一個客戶都不希望被綁定,但為什么英特爾還能不斷擴展,而且越做越好。最簡單的道理,這是一個市場化、優勝劣汰的結果。用戶可能對英特爾有意見,但比較了性能、用戶體驗、性價比等后,可能還是會選英特爾。從英特爾自身的角度出發,我們希望能給用戶帶來最好的解決方案,于是有了至強、至強融核、FPGA。同樣做網絡、存儲也都是一個道理,我們希望給用戶最具性價比的產品和方案。
盡管情感上你可能不太接受,但道理就是如此。就像筆者聽某大廠說過的一句話,用戶不選你的產品,首先要反思的是你產品是不是足夠好,而不是其他。
當使用新技術后,數據處理性能能有幾倍、幾十倍的提升(當然,其他方面成本、可靠性、安全性等并沒有太多的變化)時,可能他真的不會去再糾結是不是有被綁定的可能。
這樣的例子對于英特爾而言,有很多。
英特爾公司軟件與服務事業部副總裁、系統技術和優化部門大數據技術總監馬子雅介紹英特爾在大數據領域所做的工作
在演講中,馬子雅就舉了幾個例子。一是,一個客戶在利用英特爾新一代硬件技術(最新至強處理器、網絡、SSD)后,大數據的機組性能整整提高了7倍。
二是中國一個比較大的互聯網公司,在其已有的Spark機組的每臺服務器加一塊英特爾的SSD,整個機組的性能就能提升20%,在此基礎上,利用英特爾開發的Hierarchical storage management Solution層次性存儲軟件,使得性能再獲大幅度提升,最終的效果是整個機組性能提升70%。
三是一個Hadoop用戶,在傳統Hadoop中,數據通常存儲三個副本,這樣造成了200%存儲資源的浪費。為此,英特爾和Cloudera在開源社區共同主導開發了一個項目HDFS Erasure Coding,通過它可以把存儲成本降低一半,并把編碼器和解碼器的性能提升30倍,即便和新的Java編碼器和解碼器相比,性能也提升了6倍。
這樣的例子還有很多,從中也能看出英特爾在其中發揮的作用,就如前文所講,它不僅僅是個硬件平臺提供商,在硬件和軟件、硬件和應用之間起到了很重要的潤滑作用。