微軟CEO Satya Nadella在紐約發動大數據攻勢
兩年前,在Satya Nadella上任微軟CEO的時候,比爾·蓋茨如此評價:“微軟即將進入產品創新和業務增長的新時代,Satya對于全球將如何使用和體驗技術的愿景,正是微軟所需要的。”
2016年3月10日,微軟在紐約的時代出版集團總部舉辦了一場盛大的發布會。Satya罕見地穿西裝出現在200多位同樣也是西裝革履的客戶面前,他說上一次在紐約開發布會是為了Surface,而這一次是為了微軟數據平臺全亮相。在時代集團附近,就是著名的華爾街。
如果說Azure和Office 365是微軟自轉型以來發起的第一波攻勢,Windows 10和Surface是第二波攻勢,那么接下來的數據平臺就是第三波攻勢。從云到端再到數據,從西雅圖云計算小鎮到紐約華爾街金融中心,Satya正在帶領微軟走過轉型期、挺進新時代的開拓期——這一次瞄準的是大數據時代的1.6萬億美元巨大紅利。
1.6萬億美元數據紅利
2014年5月,市場調查機構IDC發布了“數據紅利”研究報告。IDC走訪了全球20個國家的2020多家大中型企業,涉及金融服務、零售、制造、醫療、公共事業、通信與媒體等垂直行業。根據調研結果,IDC認為積極投資大數據和數據分析的“領先型”企業總體將比不投資者獲得接近1.6萬億美元的數據紅利。
實際上,全球已經認同一個大數據的未來。2013年IDC的數字宇宙調查報告稱,到2020年全球數字宇宙規模將達到40ZB,而在2008年時這一數字僅為0.5ZB。除了社交數據外,數字宇宙膨脹的主要原因為機器數據量的迅猛增長,到2020年機器產生的數據量將超過40%。
然而,在一個大數據未來的前提下,IDC的“數據紅利”報告卻得出了三個“意外”的結論。首先,大數據和數據分析并非都是關于非結構化的社交媒體數據。IDC認為,類似社交型CRM的應用大幅提升了與用戶交互的效率,但那些在業務運營、創新和支撐等領域投資物聯網技術的企業,才是“數據紅利”的真正獲益者,而在這些領域則以結構化數據為主。
其次,盡管降低成本是“數據紅利”的最大驅動力,但提高生產力和創造新營收也是釋放“數據紅利”的重要來源。IDC預測一個四年期的“數據紅利”可讓“領先型”企業在降低成本方面獲得高達8640億美元的額外收益,但提高和創造新營收則能帶來3750億美元的額外收益、提高生產力還能創造3150億美元的額外收益,后二者不容小覷。
第三,對數據和數據分析的投資優化要結合技術、人員與流程。IDC認為,企業針對決策支持和決策自動化的投資,需要有效利用數據和數據分析。這就需要在正確的時間把正確的數據送達到正確的人員手里,即把技術、人員和流程結合起來,這才是數據平臺的投資重點。
完整的數據平臺戰略
結構化數據、創造新營收和提高生產力等,這些都意味著對傳統數據庫技術的變革。而把技術、人員和流程結合起來,則要求統一的數據平臺,而不是現在市面上眾多分散的解決方案。Satya認為,發現數據的商業價值和實現數據紅利可能需要多年的時間,而企業在這個過程中將會經歷混亂的轉換過程。
微軟在3月10日紐約發布會上重點介紹了SQL Server 2016。SQL Server 2016的重要性不僅在于多項歷史性新功能,更在于它把多種結構化和非結構化的數據模型及數據庫解決方案整合到了一個平臺上,且能運行在私有云、公有云和混合云環境中。SQL Server 2016、Azure數據平臺再加上Power BI移動可視化分析,微軟將率先完成數據平臺大統一的愿景。
市場調查機構Gartner認為,企業正在把事務處理型數據庫、關鍵業務數據庫、數據倉庫、內存數據庫、大數據處理等融合到單一數據平臺上,這將成為整個數據庫市場的發展趨勢。在Gartner發布的“2015年操作型數據庫管理系統魔力象限”報告中,微軟超越甲骨文成為全球第一的數據庫供應商,這在很大程度上歸功于可以運行在混合云環境的SQL Server。
SQL Server 2016提供的新功能包括:可通過單一T-SQL查詢關系型數據和Hadoop非結構化數據的PolyBase技術;基于內存計算和列存儲技術的數據倉庫,可在一個2TB內存的服務器里處理40TB的數據;Stretch Database技術讓冷數據可近于無限地延展到Azure上,極大降低了數據總體擁有成本;內建R語言高級數據分析技術,在SQL Server內直接完成預測性數據分析;實時數據安全加密,無論動態數據還是靜態數據都時刻處于加密狀態等等。
實際上SQL Server 2016的新功能遠遠不止上述提及的幾種,而SQL Server與Azure的融合則成為微軟數據平臺最大的亮點。在Azure的IaaS服務中本身已經提供了多種低成本、高可靠、高可用的數據存儲和管理選擇,而在Azure的PaaS平臺則提供了Azure SQL Server、Azure HDInsight大數據處理、Azure Stream Analytics流數據處理、Azure Data Lake Analytics數據湖分析、Azure Machine Learning機器學習等多種數據服務。SQL Server數據集成服務SSIS與Azure數據集成服務ADF相互結合,則很好地完成了二者之間數據銜接。
在SQL Server 2016和Azure之上,是統一的可視化分析平臺Power BI,在移動端提升用戶使用體驗。Satya上任微軟CEO后,主持發布的第一款產品就是Power BI。作為基于云的商業智能可視化交互工具,Power BI讓用戶在移動設備直觀迅速地掌握企業運營的各種數據。Satya在紐約發布會上說他每天都用Power BI察看微軟運營的關鍵數據,“數據正在改變微軟”。
從內存數據庫到集成R語言、從Power BI移動端可視化到Azure Data Lake數據湖分析、從實時安全加密到Stretch Database技術,SQL Server 2016把微軟之前在數據平臺的投資全部都連起來了。
獨有的市場競爭優勢
盡管Gartner把微軟評為操作型數據庫管理系統市場第一的領導者,而操作型數據庫管理系統本身就是面向金融交易和航空票務等聯機事務處理的關鍵數據庫技術,但微軟并沒有止步于市場調查公司的評級。
微軟云計算和企業業務執行副總裁Scott Guthrie在紐約發布會上宣布了微軟SQL Server on Linux計劃,而此前在他3月7日的博客中已經透露了這一消息,隨即在全球IT業界引起了極大的反響。目前微軟SQL Server率先把核心的關系型數據庫功能遷移到了Linux操作系統上,并已經向Linux社區開放,正式商用版計劃在2017年中旬推出。
盡管SQL Server on Linux并不是把所有SQL Server 2016的功能都搬到Linux操作系統之上,但僅把核心關系型數據庫向Linux開放,就足已引起業界的震動了。IDC企業基礎設施集團副總裁Al Gillen就此評論,微軟此舉是一個影響重大的決定,這把SQL Server數據庫擴展到了新用戶群和新市場中,打消了用戶對于微軟鎖定技術平臺的顧慮。之前甲骨文推出了基于自家SPARC芯片的數據庫一體機,引發了用戶對于甲骨文鎖定自家技術平臺的擔憂。
Gartner副總裁Merv Adrian在紐約發布會上向鈦媒體記者表示已經先期看到SQL Server on Linux的技術成果,這已經是一個成熟的解決方案。Merv特別提到華爾街有大批用戶還在使用之前基于Linux的Sybase數據庫,微軟此舉將打開之前難以突破的新市場空間。而眾所周知,SQL Server起源就是微軟、Sybase與Ashton-Tate共同開發,隨后微軟全面轉向Windows平臺,而Sybase則繼續專注在Unix和Linux平臺。
除了向Linux社區開放外,微軟還加大了與甲骨文的競爭力度。微軟北美總裁Judson Althoff在紐約發布會上指出,根據標準測試結果,集成了OLTP、EFT、數據倉庫、高級分析和商業智能等全面功能的SQL Server 2016數據庫,其總體擁有成本僅為同類型配置Oracle數據庫的1/11.7。Judson還在現場直接向甲骨文用戶發出了免費SQL Server許可證的遷移邀請。
微軟云計算及企業業務市場營銷公司副總裁Takeshi Numoto告訴記者,盡管在微軟歷史也有比較帶有進攻性的市場營銷先例,但近年來確實沒有這么大力度的舉措。微軟這一次直接向甲骨文宣戰,成為2016年市場最大的看點之一。惠普企業HPE的服務器業務高級副總裁及總經理Alain Andreoli現身微軟紐約發布會,展示了集成SQL Server 2016的HPE SuperdomX關鍵業務X86服務器比Oracle Exadata數據庫一體機的總體擁有成本低66%。
用戶是否買單?
正如Satya所說,產品發布不是重點,讓用戶真正用起來才是重點。
DocuSign是一家成立于2003年的硅谷創業公司,這家公司的主要產品為電子簽名解決方案和數字交易管理云平臺。在企業和組織機構的運營中,各種文檔的簽名授權一直是整個流程運轉的基礎。電子簽名不僅涉及到整個企業流程的電子化,還涉及到了企業隱私、數據安全、可用性等多種問題。
DocuSign首席架構師Eric Fleischman告訴記者,之所以選擇微軟作為長期合作伙伴,正是因為微軟有全面的數據平臺和云平臺,從企業數據中心和私有云到公有云和混合云,微軟都有基于開放標準的產品、服務和解決方案。更為重要的是,作為企業級解決方案供應商,微軟有強大的技術支持團隊和開發者生態社區,這讓DocuSign吃了定心丸。如今DocuSign在188個國家以43種語言服務超過10萬家企業的5000多萬用戶,每天還新增5萬多用戶,每15家美國金融機構中有10家在使用DocuSign、每15家美國保險公司中有13家在使用DocuSign。
雷諾F1車隊是另一種類型的技術型用戶。雷諾賽車首席運營官Thomas Mayer介紹說,一輛F1賽車就是基于物聯網的大數據裝置,每輛賽車都安裝了超過200個傳感器監控超過2000個數據源,每0.001秒就會采樣數據來觀測整個車輛的運行情況。當F1賽車高速運行在200mph時速時,后臺的技術團隊要實時監測車輛、風速、輪胎、天氣等多種數據,快速分析、預測和預警,幫助車手在秒級時間里做出決策。
微軟和雷諾從2012年開始就已經技術合作伙伴。除了實時流數據分析外,雷諾之前需要到流體力學CFD中心做各種模型實驗,每小時產生上百GB的數據,用于車型的研發。現在隨著已經積累了大量的歷史大數據,雷諾在微軟數據平臺可以為整車建立數學模型,讓駕手在模型設備上虛擬駕駛車輛,再與CFD實驗配合進行新車型的研發。這樣一來,整個新車的研發周期大幅縮短了,相應提升了整個車隊的盈利能力。
此外,在本次微軟紐約發布會上,江森自控集團的首席商務官John Cipolla講解了把SQL Server與IoT結合的新樓宇能源管理解決方案、Mastercard高級副總裁Jonathan White介紹了用SQL Server 2016內嵌的R語言為沃爾瑪、可口可樂、希爾頓等客戶開發的市場營銷效果預測APP、John Hopskins大學教授Alex Szalay介紹了基于SQL Server的超大規模在線天文數據庫Skyserver(迄今處理了2.8億外部SQL查詢)等等。
顯然,在企業級技術方面的長期布局和客戶積累以及前期在Azure公有云方面的巨大投資,讓微軟在全球大數據爆炸的時候作好了充分的準備。正如Satya所說,微軟的數據平臺不僅能幫助企業管理數據,更能讓企業從傳統業務轉向軟件和數據業務。這個歷史性的轉型,才是微軟真正看重的未來。
1.6萬億美元的數據紅利,需要全球的個人、企業和組織,與微軟這樣積極投資新技術的技術供應商一起去共同創造。這,才是一個大數據未來的真正含義。所以Satya才在3月10日SQL Server 2016的紐約發布會上說,“今天是一個里程碑。”