對于當今的企業級服務市場來說,大數據技術的不斷深入已經使得很多行業的用戶開始擁抱大數據,我們都知道,對于數據而言,我們每天所產生的海量數據需要有一個強有力且安全的平臺來對這些數據進行收集、分析從而為用戶提出一個切實可行的方案,來幫助用戶解決因數據困難導致的企業IT問題。
對于整個大數據行業來說,基本上可以分為三層,分別是底層基礎平臺,中間層通用技術,上層行業應用。那么對于一家大數據服務企業來說,為用戶提供基于這三個平臺的大數據服務的過程當中,這些平臺的根本,其實是需要一個強大的底層硬件基礎平臺來為這些海量數據做保障和支撐的。
Hadoop:底層技術的明星
對于底層的基礎平臺來說,其主要起到了數據存儲、計算等過程當中的問題,它也是整個大數據生態當中的根本基石,用戶從采集到數據開始,底層基礎平臺就是保證用戶能夠把這些數據高效、快捷的進行存儲,而后才能進行高效的數據分析和挖掘,從而幫助用戶解決企業IT問題。
統觀當前國內的企業級市場,真正把目光專注于Hadoop的企業級廠商數量其實并不是太多,有業內專家曾經指出,在進入新世紀后的第一個十年當中,跟多企業都把發展的重點放在了IT設備的采購、數據中心機房的建設以及各種辦公系統的上線等方面,而第二個十年當中,隨著經濟形勢的下行,使得傳統企業的盈利開始出現下降的趨勢,對于企業級用戶來講,對于IT設備的采購也就不像之前那十年那樣狂熱了。
以Hadoop為代表的新底層技術能夠興起,拋開技術原因,最主要的原因是便宜、擴展性強。利用分布式架構,將一些性能一般的機器串聯起來,達到與高性能單機同樣的效果。隨著公司發展,數據量增大,不需要更換全套設備,只需要再增加機器就可以達到目的,省時省力。
利用Hadoop發展起來的商業模式
以微軟的Cosmos為例,這套系統本身優于Hadoop,主要是針對大型機房,設計理念很好,上萬臺機器的機房,拿出幾十臺做別的事情,來提升系統運營效率。但如果是幾十臺機器,仍然需要拿出很大一部分來做別的事情,機器使用效率就很低。
實際應用時,用上萬臺機器的公司少,用幾十臺機器的公司多,因此Hadoop的應用面更廣。用的人多,自然幫助優化架構的人多,社區貢獻的人多,技術發展快,漸漸成為主流。
Hadoop技術是開源的,為什么還有公司會提供Hadoop相關服務?這是因為開源技術的兼容性和穩定性比較差,同時,企業在實際應用中需要將開源技術和自身系統、產品相連接,這就是Hadoop發行版的市場所在。
當前,銀行等大型企業紛紛喊出“去IOE”(IBM小型機、Oracle數據庫、EMC存儲設備),盡管國產企業的產品尚不能滿足大型企業核心系統的要求,但是必然會有大量新業務的IT系統采用國產品牌,舊有業務面臨更新換代也會優先選擇國內廠商。
數據庫等底層設施不同于上層應用,更換成本較高,客戶黏性很大,非萬不得已不會進行替換,同時Hadoop這類新技術迭代速度快,需要后期維護。因此,各家公司都在大力開拓市場,跑馬圈地。
發展大潮下創業公司有幾分機遇?
隨著IT領域“去IOE”浪潮的快速發展,已經開始有越來越多的中國企業都在面對更換自身原有的IT硬件設備的問題,這對于整個底層基礎平臺市場來說是一個絕好的發展機遇,因此近些年我們也可以看到越來越多的初創型公司利用其技術優勢和初創公司的高效決策機制,迅速搶占一些市場份額,占據一席之地。這類公司主要服務金融、電信、交通、電力等領域的大型企業,這些領域原本是傳統集成商的地盤,因此新興大數據公司不可避免地將與集成商正面競爭。
底層基礎平臺不同于上層應用,客戶需求類似,產品很難體現出差異化優勢。各家公司主要比拼產品性能的優劣,這種技術上的差異,新興公司最初會占據一定優勢,隨著開源技術的普及,很多公司也會逐步趕上,技術的差距會逐步縮小。
Hadoop誕生于2006年,Spark于2009年出現,2013年Hadoop已經發布2.0穩定版本,兩種技術從誕生到成熟時間之短,令人震驚。在當今這個技術快速發展的時代,新興大數據公司一方面要應對市場競爭,另一方面還要保持技術的領先地位,難度不小。
編輯的話
對于大數據產業來說,除了在平臺化管理要從用戶角度出發之外,對于企業的底層硬件平臺來說,也需要更加迎合實際的應用環境來對產品進行采購和升級換代,一個強大、安全、穩定的底層硬件平臺對于大數據在用戶端的豐富應用起到了決定性的作用,所以我們說,一切還是要以用戶的需求作為根本出發點。