IBM的研究人員在展示通過數據分析提高城市交通水平
下個世紀是大數據的世紀,是從IT走向認知計算的時代。在IT時代成就了一家超級平臺,這就是淘寶,而認知時代要做的是數據的生意,那是否有一個類似淘寶的超級數據平臺呢?IBM正在做這件事情。
IBM在全球布局了40多個基于Softlayer的數據中心,以Bluemix作為其主力云端開發平臺, 在之上通過合作和收購網羅了從Twitter到The Weather Company以及這些年投入250億美金收購的Cognos、SPSS、ILOG、Algo等諸多頂尖分析公司,再加上收購的Compose 所囊括的業界7大開源數據庫等,以期搭建一個“淘寶”式超級數據平臺。
2016年3月底,IBM向中國市場披露了其數據分析戰略——由多個專有及開源數據庫、多種大數據及商業分析算法以及多種數據源接入的“淘寶式”超級平臺,再通過優化的后臺管理、運維和用戶體驗,為上至專業開發者下至普通小白用戶,提供各類數據服務。
跨越數據管理鴻溝
大數據時代的核心價值是數據分析,這個已經成為共識。但數據分析需要有數據,有數據就需要有數據庫和數據庫管理服務。
那么,現在一共有多少種數據庫產品?由澳大利亞IT咨詢公司solid IT創建的數據庫知識網DB-Engines,就監控了全球260多種流行的數據庫產品,其中包括商用數據庫產品以及開源數據庫產品,涵蓋關系型和非關系型數據數據庫。
面對這么龐大的數據庫產品及服務,即便是專業開發者也要忘而興嘆了。特別是當數據庫與云服務結合形成了云數據服務,即在混合云環境中部署數據庫及數據分析服務,除了核心數據庫管理外,還涉及到跨云的數據存儲、遷移、熱備、整合等復雜的云管理技術。
異構數據、異構數據庫、異構云環境,這就成為了現代企業面臨的數據管理鴻溝。對于IBM等企業級IT服務商來說,如何幫助企業跨越數據管理鴻溝,就成了繞不開的問題。于是就出現了IBM過去幾年大力收購數據及數據庫管理公司的現象。
大數據“淘寶”商城
IBM的數據分析戰略包括了數據分析服務、云數據服務、數據集成服務、數據治理服務、數據集市、跨云的數據連接、混合云管理及云存儲服務、行業解決方案和開發者服務等在內的完整鏈條,這些構成了IBM在大數據時代的“淘寶”商城。
在這個大數據“淘寶”商城中,最重要的“寶貝”就是云數據服務(提供DBaaS數據庫即服務),即各種流行數據庫的云化、集成、優化與管理。這是什么意思呢?以IBM收購的Compose為例,2015年7月IBM收購了開源數據庫管理公司Compose。Compose是一家能為企業用戶管理MongoDB、PostgreSQL、Elasticsearch、Redis、RethinkDB、etcd、RabbitMQ等七種最流行開源數據庫的服務商。
Compose為用戶提供的增值服務包括:由專家負責的24x7全天候數據庫監控與管理、數據庫的容器化及部署、不間斷和無故障的數據庫服務、不同數據庫之間的數據遷移等。目前,Compose已經為數千家企業用戶創建和管理了超過十萬個數據庫。
而早在2011年IBM就已經推出于基于Apache Hadoop的大數據分析服務商用版InfoSphere BigInsights和InfoSphere Streams。2015年,IBM進一步強化了實時數據分析,通過Apache Spark重新設計了超過15個核心分析與商務解決方案,例如基于Spark技術把數據準備和優化服務IBM DataWorks的代碼庫從4,000萬行代碼壓縮至500萬行。IBM還推出了基于Bluemix平臺的Spark-as-a-Service服務。
IBM在2014年收購的Cloudant更是大名鼎鼎,這家創業公司的產品是基于開源CouchDB架構的托管數據庫。Cloudant的強項在于永不宕機、動態擴容以及分布式異地多活存儲,特別適合電商、在線游戲、金融支付等應用場景。
當然IBM自有的數據庫和數據倉庫產品,包括經典的DB2數據庫、DB2 BLU(內存列存儲加速)、dashDB(內存列存儲數據倉庫)、Informix(TimeSeries)等,都擁有大批的傳統企業用戶,這些產品經過云化后也成為IBM云數據服務的一部分。
目前,IBM提供了25種專有及開源數據庫的云數據服務。IBM大中華區副總裁、大數據與分析事業部總經理丁少忠表示,IBM云數據服務的核心競爭力在于擁有這些數據庫的源碼,在源碼級為用戶提供管理服務(Managed Service),這極大降低了企業IT和開發者的負擔。
除了這25種數據庫即服務外,IBM還在2016年初推出了云化的中間件WebSphere Connect,其中包括了DataWorks、API Connect、APP Connect等組件,進一步擴展了IBM連接更多數據及云服務的能力。
引入預測分析和更多數據源
在IBM的數據分析戰略中,云數據服務是用戶當前馬上就可以用到的服務,而面向未來的預測性數據分析才是IBM真正希望帶來更高商業價值的服務。
目前IBM的預測性數據分析服務包括了Watson Analytics以及SPSS for Machine Learning兩大類。其中,基于認知計算的Watson Analytics,以自然語言交互和可視化分析界面,把機器學習和預測性數據分析的門檻降低到了最低。
普通人沒有經過專業訓練,也能用Watson Analytics完成商業預測分析。市場營銷、HR專員、金融分析等能簡單直接地用Watson Analytics實現高級認知分析,比如直接向Watson Analytics提問后,Watson Analytics能采集、提取、精簡數據,并從中發現趨勢、預測成果、執行可視化分析、創建報告或儀表板等,而且整個過程都可以用自然語言交互。
Watson Analytics分為免費版、個人版和企業版,其中的免費版就已經能提供豐富的功能了。Watson Analytics在全球已有超過一百萬注冊用戶,在大中華區剛剛推出就獲得了近2萬個注冊用戶。
SPSS for Machine Learning則是基于經典的統計分析軟件SPSS。2009年,IBM以12億美元收購了SPSS公司,隨后又擴充了統計學分析運算、數據挖掘、預測分析和決策支持任務等豐富的功能。有著40多年歷史的SPSS,是目前應用最廣泛的數據挖掘預測工具。
除了向中國引進Watson Analytics和SPSS for Machine Learning外,IBM還引入了超過150種公共和免費數據源構成的信息庫,其中包括了剛收購的The Weather Company。作為美國第四大使用最頻繁的App,Weather公司每天處理高達260億條云服務查詢,是IBM數據服務和Watson物聯網業務的支柱。
借助Weather公司的平臺,IBM現在可以收集來自世界各地數十億個物聯網傳感器的數據,這些數據來自于汽車和飛機遠程信息處理系統、建筑和環境傳感器、可穿戴的設備、醫用植入物、氣象站、智能手機、社交媒體、制造生產線和供應鏈等。接下來,IBM在中國市場將率先推出針對航空公司、媒體、手機廠商等多個領域的服務與合作。
繼發力認知商業和認知計算后,IBM的大數據與分析業務也將在中國市場逐一落地,為中國的企業、開發者以及軟件開發商等,搭起一個面向認知商業時代的“淘寶”式超級數據平臺。有了這個超級數據平臺,物聯網、智慧城市、智能制造等新經濟、新業務形態才能真正發展起來。