“貞,登婦好三千,登旅萬乎伐羌。”這是講述商王武丁時代的女將軍婦好征戰的一段甲骨文,大致的意思是說,商王征發婦好所屬的3000人馬及其他士兵1萬人,命他們去征伐商王朝的宿敵羌國。
中國古人在文字上是出了名的冷色,一個字、一個詞,在不同語境、時代、內容中所指代的意思可能千差萬別,更何況是刻在區區骨片上的甲骨文,這造就了中國歷史上最困難的文字識別工作:在已發現的2500字甲骨文中,如今能夠識別出其意思的只有1500個字,而它們所代表的含義超過3000多種。
在大數據的時代,識別困難的是每天新增的數以億計的數據,企業的數據每天都在以TB、PB的數字上升,全球每年新增的數據量已經開始用EB和ZB來形容。在這樣的一個時代,另一個“甲骨文”——Oracle,正在開始它全新的使命:讓數據展現出它所代表的深刻含義,這一工作與我們對幾千年前的“甲骨文”所做的事情,沒有什么本質的不同。
但在工作的形式、流程以及平臺上,兩者卻存在著巨大的差異。
千年以前的甲骨文只能夠靠人工和簡單的機器比對、分析逐步揭開它神秘的面紗,我們也并不真的那么迫不及待的要將剩下的1000多個字全部解讀出來;后者則在時間——急迫性——上與前者完全不同,企業的競爭態勢每分每秒都在變化,數據也在不斷地被創造,并需要被存儲和分析,相對今天的生活,商王武丁和婦好女將軍的時代,時間處在停滯狀態。
大數據創造了巨大的機會,更是新的IT技術、云計算平臺的巨大機會,在企業業務IT流程化時代——數據庫、數據倉庫、ERP、HCM、CRM所統治的時代——具備著巨大影響力的甲骨文公司,如今自然不會錯過這個新的機遇。
在甲骨文使用這些“武器”的過程中,其大數據戰略正在顯露:完整的軟件業務生態環境、專業化的數據與業務分析平臺、軟硬件一體化的Exa系列產品以及全球規模化的服務團隊、極強的數據分析和流數據處理能力,所有這些都是這家公司的過人之處。
但也正是在甲骨文這一過程中,我們看到了大數據許多并不為人所知的一些側面,這些話題有的可能還只是剛剛處在概念階段,有的可能還需要很長的路要走,有的可能甚至不會成為業界的熱點話題。
對于繼續需要知道“新甲骨文骨片”上的含義的企業CIO、CEO們來說,在了解甲骨文的大數據戰略的過程中,發現這些是具有極大的戰略意義。
快數據:大數據的下一個核心
在市場上,只有兩家供應商擁有全數據生命周期的計算、存儲、分析、展現解決方案,一個是紅色的甲骨文,另一個是藍色的IBM,這兩家公司在IT領域各有所長:前者的大型機與UNIX服務器一直是業界的標桿,商業智能分析上實力不俗;后者的一體機概念如今已經深入人心,是這一市場絕對的領導企業,而在業務系統、數據展現上有著強大的競爭實力。
在大數據市場,甲骨文構建了一個完整的數據“流程”:從Oracle大數據一體機、Oracle大數據連接器、Exadata 數據庫云服務器、Exalytics商務智能云服務器,再到Oracle Endeca Information Discovery、Oracle實時決策、Oracle事件處理、R語言,尤其是強大的Oracle數據庫與中間件,構成了大數據從捕獲、存儲、計算、處理、分析、發現、展現等全生命流程處理。
但與競爭對手將數據洞察和分析放在唯一首位不同,Oracle除了數據分析、捕獲和洞察,還提出了一個“快數據(Fast Data)”的概念,為了得到全面、透徹、完善的市場洞察,大數據應完全覆蓋傳統數據、非結構化數據、流式數據和快數據,共同為企業構建全數據視圖,提供全面的信息支撐,而讓數據流動的整個流程變快,無論在大數據時代還是之前的時代,都是其中的關鍵。
對于Oracle來說,大數據時代不如說是快數據時代:拉里·埃里森熱衷于通過一體機與軟硬件結合的方式加速其業務系統的性能、Oracle實時決策提供的是實時和歷史數據的雙軌處理——在大數據時代,“不談數據分析的解決方案是耍流氓,而速度緩慢、無法提供實時性的解決方案則跟強奸用戶沒什么兩樣”。
大數據時代需要的是迅速做出反應,處理大量動態的、快速變化中的數據,高速數據可以帶來更高的價值,對于多變的業務流程來說更是如此,有些高速數據在短時間內就會失去價值。
甲骨文公司副總裁及大中華區技術總經理喻思成在講解Oracle的大數據戰略時所談到的各種類型的數據:傳統數據、非結構化數據、流式數據,其根本的轉化方向都是“快數據”,但Oracle一開始并未在全部的解決方案中貫徹這一概念,正如喻思成所說:“甲骨文開始所說的快數據是對流數據的處理。”
但現在,甲骨文正在將快數據的概念融入到整個大數據解決方案中,在這個超越于整個Oracle數據庫產品之上的大數據解決方案中,快數據是貫徹Oracle各個不同層面、領域、行業的數據解決方案的核心。
甲骨文正在達成的大數據目標,是將實時的事件、變化轉變為快數據,通過業務決策系統、處理和存儲系統、信息發現和處理系統,最終以最快的速度展現出來,或許在未來,大數據的“4V”解決方案會變成“4V與S(Speed)”——數據需要速度,大數據更需要速度。
大數據:云整合應用的誘因?
如何從大數據中進行信息發現?喻思成給了一個“復雜的答案”:自上而下,是識別業務挑戰、識別信息空白、識別潛在信息源、獲取數據并實現數據發現、識別新量度對其進行建模以支持BI;自下而上,企業要標準化和發布應用、識別業務驅動因素和量度、建立信息發現模型、識別屬性和關系、識別新的數據集——為了取得更好的業務成果,企業的IT部門從IT基礎設施、中間件、數據庫、數據發現、識別、分析、決策預測,要將任意——而不是指定的——數據轉變為更好的決策和更快的行動,這是一項極為復雜的工作。
即便是在軟硬件趨于一體化的今天,借助甲骨文的軟硬一體優化集成的大數據平臺,企業仍然要面對流、獲取、組織、分析和決策者五大業務平臺的將近20個(在不同要求下,這個數字可能更多)的不同軟件和硬件產品,在Oracle的戰略下,這些產品被盡可能的軟硬一體和預先集成,但這仍然是一個艱巨的任務。
有沒有可能企業只需做兩件事情:輸入數據和獲得結果?如果采用傳統的IT基礎架構搭建方法,這顯然是不可能的,在每個環節緊密連接的大數據平臺處理流程中,企業所需要的技術、產品、知識和經驗都異常繁多,而對Oracle來說,這雖然是企業服務團隊的巨大贏利點,但更大的負面作用,是企業很可能會對此望而卻步。
這就是云計算,或者說公有云的重要意義所在。通過公有云服務,供應商可以將所有這些復雜性包裹在黑盒中,隱藏前端云計算服務的背后,企業無需采購軟硬件設備、無需集成和調試也無需去為維保、服務而發愁,只需要兩個接口:數據提供和展現接納,這無疑是公有云服務所能提供的最大誘惑。
或許是受限于媒體溝通會內容的限制,喻思成并未回復有關“Oracle的大數據戰略是否通過Oracle公有云服務能夠更好服務用戶?”的問題,但他談到,對于Oracle來說,私有云與公有云同樣重要,如果企業希望自主構建大數據解決方案,Oracle能夠提供最全面的幫助;如果企業希望通過公有云服務來獲取這些能力,Oracle的公有云——Oracle Cloud——正在提供越來越多的數據服務。
目前,Oracle Cloud提供了8大類云計算服務,與大數據直接相關的包括公有云計算、公有云對象存儲、BI商業智能、數據庫等相關服務,雖然其在大數據方面的專門服務還處在初級階段,但隨著Oracle大數據戰略的逐步完善,Oracle Cloud在大數據功能上的完善也將是自然而然的事情。
一年半以前馬克·赫德在接受中國媒體采訪時曾經說過,Oracle并不怕SaaS服務以及公有云服務會搶占Oracle原本利潤可觀的軟件許可證銷售制度,他認為:“Oracle在云計算和SaaS領域擁有強大的實力,是競爭對手望塵莫及的。”
“SaaS是否會改變我們的生態環境?改變?當然有!但是,甲骨文會是全球最大的SaaS供應商。”馬克·赫德表示,甲骨文會在SaaS市場獲得遠超競爭對手的收入——當大數據正在將企業的CIO和IT經理們推向公有云服務時,馬克·赫德的預言可能會真的變為現實。
無論是Oracle還是IBM,亦或是惠普,在當下每一家供應商都能夠提出多項大數據與云計算服務、技術產品與競爭優勢的環境下,這些軟件方面擁有強大實力、硬件平臺同樣占有不錯市場的公司,都能夠為自己的大數據戰略勾勒一副極為廣闊的藍圖,但他們也同樣面對兩個問題:作為供應商,你的大數據戰略中有沒有獨樹一幟的精髓?你的大數據戰略所涉及的數十項技術和產品,如何簡單的被企業用戶所使用?