目前,商業工具在數據虛擬化軟件市場占據主導地位,但在數據管理和分析等領域,開源技術開始迎頭趕上,比如D3.js數據可視化庫,Leaflet地圖庫,再加上附加交互可視化功能的R語言(一種廣泛用于統計分析的編程語言)。
當然,對于開源數據可視化工具也有一些批評的聲音,例如有人認為這些工具的使用門檻太高,使用者必須具備大量代碼知識,還要經過專門培訓。不過,熟悉開源可視化工具的用戶透露,隨著技術部署的不斷深入,這些可視化產品用起來會越來越得心應手。而對于R語言,很多軟件供應商都為企業用戶提供商業產品。
Paul Bradley是美國醫保管理SaaS云應用供應商ZirMed公司的首席數據科學家,他認為:“這些工具之所以開始流行起來,是因為它們成熟且可用。用戶根本感受不到開源工具的限制,因為在觸碰到限制之前就能完成大量工作。”Bradley是R語言的擁躉者,他介紹到,供應商RStudio公司針對R語言開發的同名圖形用戶界面就很友好,而且也不需要太多的代碼知識。
Bradley的觀點得到了Clement Brunet的認同,Brunet是美國保險公司The Co-operators的研究和分析主管。在波士頓舉行的數據倉庫研究院(TDWI)2015大會演講上,Brunet表示:“有R語言在手,你可以走的很遠。”他認為如果要在概念證明(POC)階段開展實驗性分析項目,之后再擴展到產品應用,那R語言簡直是不二之選。而且隨著R語言環境在本質上變得更加圖形化,工作會越來越容易。
美國在線借貸公司Avant同時使用了商業化的商務智能(BI)軟件和開源的數據可視化技術。該公司的BI負責人Charles Whittaker表示,任何能夠幫助他節省數據可視化時間,讓他能夠集中精力進行數據分析的東西,他都感興趣。他表示,D3庫預建的圖形正能滿足他的需求,這些圖形讓Whittaker這樣的用戶“能夠把資源集中在數據挖掘和數據科學上,而不是去創建酷炫的圖表”。
如果要簡化流程,咨詢公司PowerTrip Analytics的聯合創始人兼首席數據科學家Stephen McDaniel建議使用具有省略數據發現功能的開源可視化工具,可以讓用戶專注于創建表格和圖形。華盛頓大學開發的開源工具Lyra備受McDaniel青睞,他稱之為“數據可視化領域的Photoshop”。
McDaniel介紹道,Lyra采用D3框架,D3框架是JavaScript文檔的組合,需要用戶執行一些手動編碼,可以通過點選式(只要用鼠標點擊而不用鍵盤操作就可以使用的容易上手的軟件)界面自動完成任務。因為輸出格式采用的是HTML、SVG或CSS等常見的網站語言,所以數據可視化結果很容易在組織中傳播,也很容易發布到網上。他還表示:“這正是我們所需要的,現在我們要做的不是如何反復研究數據,而是如何構建具體的圖形,把他們發布到網站服務器上,融入到內容中,讓所有人都能使用。”