微軟公司日前公布了圍繞Windows和SQL Server 12的更多細節,這兩款操作系統可以通過與Apache Hadoop更加緊密的結合來主持大型數據分析,Apache Hadoop作為處理每天產生的大規模非結構數據的開源云平臺應用日漸普遍。
憑借這種改進,微軟公司可以將大型數據帶入主流。按照他們的說法,隨著市場上的工具趨于復雜和價格高昂,只有擁有大筆IT預算的大型企業才能從這種數據分析中受益。
微軟公司的戰略是推薦偏向LINUX的Hadoop來搭配Windows環境,可以為企業用戶提供一種通過熟悉的桌面系統應用軟件(比如EXCEL或者BI工具這樣的Microsoft PowerPivot)來一鍵式,無縫和同步訪問結構化數據和非結構化數據。
微軟公司青睞Hadoop并非什么新鮮事。諸如Cloudera和Datameer這些云新興企業在過去幾年里一直都在強化這款平臺來面向企業級消費,用來擴展管理和配置工具,針對流工作編程甚至通過電子數據表格類型的前端來實現Hadoop數據更加輕松的使用和管理。另外,微軟的這一舉措也是雷蒙德在今年8月有意將Hadoop和SQL整合在一起的佐證。
不過微軟對Hadoop的立場自從2009年微軟公司技術總監David J. DeWitt對Hadoop來替代SQL持否定態度以來發生了180度的大轉彎,那時DeWitt曾說過“我們絕不會將Hadoop代碼應用到我們的任何一款產品當中去”。
顯然,微軟公司絕不會對Hadoop逐漸成為大型企業級用戶選擇的平臺這一事實坐視不理,包括臉譜,谷歌,IBM和很多很多大型企業都在使用Hadoop。甲骨文最近也宣布大型數據應用工具會將對Hadoop的支持包括在內。甚至戴爾公司去年8月也公布了銷售預裝Hadoop服務器的計劃。
另外,微軟公司當然不會忽略了為臉譜和推特這樣的大型企業分析大規模數據流所帶來的收益。企業代表著一系列的行業,包括金融,衛生,政府,學術,政治和娛樂等各個行業,都已經從收集和檢索這些大規模數據中獲得了非常有價值的成果。
現在所面臨的真正挑戰是如何實現Hadoop與SQL Server,Windows Server和Azure這些我們所熟悉的標準桌面系統應用軟件的無縫對接,這些桌面系統應用軟件所執行的大型數據分析在計算機科學領域都是不需要一個級別的。對此微軟公司并不孤單;日前微軟公司宣布與來自雅虎的Hortonworks(成立3個月時間)結成合作伙伴關系,以此來彌補Hadoop和Windows Server以及Azure之間的差距。
微軟公司計劃在今年年底前推出以Hadoop為基礎的Windows Azure服務社區技術預覽版;以Hadoop為基礎的Windows Server的社區技術預覽版預計在2012年隨后推出。
為了實現更緊密的整合,微軟公司還推出了Hadoop Connectors for SQL Server和Parallel Data Warehouse的最終版本,企業用戶可以使用這兩款軟件將Hadoop與他們現有的SQL Server環境整合起來。
除了Hadoop以外,微軟公司還展示了他們的Data Explorer,這是一款幫助企業級用戶輕松挖掘,豐富和共享數據而設計的原型技術。這款工具預計會和Windows Azure MarketPlace整合在一起。;另外微軟公司還介紹了他們的Power View技術,也就是之前的Project Crescent,這種技術可以實現Windows設備的交互式觸摸功能。