Intetix Foundation(英明泰思基金會)由從事數據科學、非營利組織和公共政策研究的中國學者發起成立,致力于通過數據科學改善人類社會和自然環境。通過聯絡、動員中美最頂尖的數據科學家和社會科學家,以及分布在全球的志愿者,我們創造性地踐行著我們的使命:為美好生活洞見數據價值。
原文鏈接:39 Data Visualization Tools for Big Data https://blog.profitbricks.com/39-data-visualization-tools-for-big-data/
原作者:Andy Lurie
數據可視化無處不在,而且比以前任何時候都重要。無論是在行政演示中為數據點創建一個可視化進程,還是用可視化概念來細分客戶,數據可視化都顯得尤為重要。以前的工具的基本不能處理大數據。本文將推薦39個可用于處理大數據的可視化工具(排名不分先后)。其中許多工具是開源的,能夠共同使用或嵌入已經設計好的應用程序中使用,例如JavaScript,JSON,SVG,Python,HTML5,甚至有些工具不需要任何編程語言基礎。其他的則是商業智能平臺,能夠進行復雜的數據分析并生產報告,并配有多種方式實現數據可視化。無論你是需要對數據進行分析并且決定用最好的方式向你的客戶或同事進行展示,還是你心里有一個視覺化布局但需要將此概念應用到生活中,該表單中總會有一款工具能夠滿足你的需求。
ProfitBricks Cloud Computing – IaaS – 大數據優化
ProfitBricks云計算 - IaaS的是所有的大數據工作負載和項目的最佳平臺。每一個云服務器實例具有專用的CPU內核、專用RAM和80Gbps在不同服務器之間進行鏈接和儲存。該平臺性能高,延遲低,將大大提高你的工作效率??梢悦赓M試用14天,馬上注冊,無需信用卡。
1.Polymaps需要在地圖上展示復雜的數據集?Polymaps是一個免費的JavaScript庫,也是SimpleGeo和Stamen的開發的一個聯合項目。這種復雜的地圖疊加工具可以加載多種規模的數據,提供多級別縮放功能,大到國家,小到街景。
主要特點:
l 使用可縮放矢量圖形(SVG)
l 展示國家、州、城市、社區和街景
l 基本的CSS規則控制設計
l 圖片是球形墨卡托瓦格式
費用:免費
2. NodeBox // @Nodebox實驗媒介研究小組(Experimental Media Research Group)開發的一組開源工具,NodeBox的兼容性是跨平臺圖片庫或Mac的app都能創建Python編碼的2D界面。
主要特點:
l 與標準設計應用程序集成
l 跨平臺,基于節點的圖形用戶界面(GUI)
l NodeBox1 – Python編碼、2D界面的Mac應用程序
l 導入多種類型的數據,包括Excel
l 動畫效果
l 運用最少的編程技能建立一個生產設計
費用:免費
3. FlotJQuery的一個JavaScript繪圖庫,Flot是一個基于瀏覽器的應用程序,并且能夠兼容大多常見的瀏覽器,包括IE、Chrome、Firefox、Safari和Opera。Flot對于數據觀點支持多種可視化選擇,交互式圖表、堆疊式圖表、平移和縮放,以及通過各種插件實現各種特定功能。
主要特點:
l 支持線性、圖片,用任何組合填充區域
l 在同一個數據序列里運用組合展示元素
l 繪圖分類以及文本數據
l 增加DOM操作標準的HTML
l 產生切換系列交互式視覺效果
l 直接的畫布準入繪制自定義形狀
費用:免費
4. Processing // @ProcessingOrgProcessing創建之初為教計算機基礎知識在視覺環境的一種手段,但現在由學生、設計師、研究者、藝術家和業余愛好者使用,用于創造學習模型和實際產品的原型。用戶可以創建簡單或復雜的圖像,動畫,和相互作用。
主要特點:
l 2D、3D和PDF格式輸出
l 交互作用程序
l Open GL一體化
l 超過1000個庫的附加功能
l 創建交互、文本、動作和動畫
5. ProcessingjsProcessing的姐妹站點,Processing.js這個工具可以處理復雜的數據視覺化、圖形、圖表或是其他視覺效果,并是網頁可用的形式,并不需要任何擴展程序或插件。這就意味著你可以運用標準Processing語言寫代碼并且插入到你的網站,而且Processing.js并不需要額外的編碼需求來實現其功能。
主要特點:
l 允許Processing代碼可以在任何HTML5瀏覽器運行
l 動畫和交互式可視化效果融入任何web 頁
l 沒有額外的編碼需要
費用:免費
6. TangleTangle是一個JavaScript庫和工具,不僅僅是視覺化,還允許設計師和開發者創建reactive程序,對數據的關系可以提供深層理解。例如,一個網頁端的轉換計算器能夠轉換貨幣或測量。
主要特點:
l 允許讀者來改變參數
l 基于定義的變量、格式和分類
l 運用Tangle類創建圖表和其他可視化效果
l 能夠創建動態的展示
l 同時使用多種變量建立控件和視圖
費用:免費
7. D3.js一個強調網頁標準的用來創建數據可視化JavaScript庫。使用HTML、SVG和CSS,可以讓使用者以數據驅動的方式去操作DOM,能夠滿足現在瀏覽器的兼容性并且不受專用框架的限制。
主要特點:
l 綁定任意數據到DOM
l 創建交互式SVG條形圖
l 從數據集里產生HTML表格
l 多種組合和插件來增強兼容性
l 內置的可重復使用的組件以便于編碼
費用:免費
8. FF Chartwell // @FontFontFF Chartwell將簡單數字串轉換會可編輯的數據可視化,并進一步的自定義使用OpenTy功能。它是能夠用于標準設計套件,例如Adobe Creative Suite,簡單化圖表的設計。
主要功能:
l 使用簡單的數據串來產生圖表
l 有利于創建一個大信息圖元素
l 沒有編碼功能節省時間
l 與設計應用程序一體化
l 多種可視化類型
費用:
l 所有功能-$119
l 單個功能-每個$25 (條形、垂直圖、線形圖、餅圖、雷達圖、環形圖、玫瑰圖)
9. Google Maps // @GoogleMaps谷歌地圖提供一些APIs給開發者,例如谷歌地球、谷歌地圖圖像和谷歌地方信息。這些工具能夠使開發者為任何應用程序或網站建立交互式視覺地圖程序。
主要特點:
l 將地圖嵌入網頁中
l 提出有關機構、感興趣的地方和其他位置的數據
l 能夠使網站訪問者在你的網站限制范圍內使用谷歌地球
10. SAS Visual Analytics // @SASsoftwareSAS可視化分析工具為了更加全面的分析能夠探索各種尺寸的數據集可視化。擁有直觀的平臺和自動化預測工具,SAS視覺分析允許甚至可以讓無技術基礎的用戶來探索數據和潛在機會之間更加深層次的關系。
主要特點:
l 在前置或公共或私人云上部署
l 拖放圖表自動為數據選擇最好的布局
l 彈出提示區識別潛在的重要的相關性
l 場景分析能夠在變量變化基礎上進行預測
l 存儲視圖為報告、圖片或SAS移動端
l 用戶易于使用數據來整合行為元素
費用
l 完整功能免費演示版(不同環節之間不能儲存報告)
l 按要求報價
11. Raphael一個JavaScript庫用來在網頁上創建矢量圖形,Raphael使用SVG和VML,因此每一個被創建的圖表同時也是一個DOM對象,Raphael的目標是能夠矢量圖表作品能夠跨瀏覽器兼容。
主要特點:
l 網頁上包括Raphael.js功能
l 創建多種多樣的圖形、表格和其他數據可視化
l 多圖表能力
費用:免費
12. Inkscape // @InkscapeInkscape提供的功能類似于Corel Draw和Illustrator軟件,然而它的開源編輯器是矢量圖形。Inkscape支持許多先進的SVG功能,因此能夠輕易使用,并鼓勵開發者在社區環境里合作。
主要特點:
l 類似標準軟件處理復雜的圖表任務
l 內置的SVG格式
l 創建網站原型
l 導入和顯示位圖的功能
l 文件儲存為矢量圖
費用:免費
13. Leaflet // @LeadletJS一個開源JavaScript庫,Leaflet是用來創建移動友好性、交互式地圖的工具。由Vladimir Agafonkin和一個團隊貢獻開發而成,Leaflet設計的目標是簡潔性、表現性和易用性。
主要特點:
l 所有主要桌面和移動瀏覽器上能工作
l 各種擴展功能的插件
l 一體化的互動功能
l 多重可用地圖層
l CSS3功能提供流行型的用戶交互作用
l 消除移動設備上敲打延遲
費用:免費
14. CrossfilterCrossfilter使我們能夠在瀏覽器里探索大量多元數據集,也是JavaScript庫,能夠處理超過一百萬記錄的數據集。Crossfilter使用語義版本控制并且易于使用值、目標和其他元素和命令來自定義的創建數據可視化。實際上,它使Square Register的商家有權利操縱銷售和購買數據。
主要特點:
l 使用語義版本控制
l 探索大量多元數據
l 快速增量過濾和減少
l 提高實時直方圖的表現力
費用:免費
15. Open Layers 3可以用OpenLayers在任何網頁里插入一個動態地圖。它執行JavaScript API用于建立網頁端地理學的應用程序,并且不需要服務端依賴關系能在大多數現在的網頁瀏覽器工作。它是一個開源軟件,結合了最新的HTML5和CSS功能,提高了3D功能。
主要特點:
l 在大多數現代網頁瀏覽器里工作(平鋪和矢量圖冊)
l 不需要服務端依賴
l 創建個性化嵌入的、動態的地圖
l 縮放功能、地理位置和其他函數功能
l 開箱移動支持
費用:免費
16. KartographKartograph即使Python庫也是JavaScript庫,迎合了想要創建友好型Illustrator SVG地圖和交互式地圖的開發者,并且能夠在各主要瀏覽器上運行。
主要特點:
l 兩個庫:Python和JavaScript
l Kartograph.js能在幾分鐘內創建交互式地圖
l 獨立運作,不需要服務器
l Kartograph使用簡單型的Visvalingam創建緊湊型SVGs
l 地圖上的數據集層能進行多層級可視化
費用:免費
17. Microsoft ExcelMicrosoft Excel因為它的數據處理和分析功能而廣泛聞名,但是它經常用于創建強大的數據可視化。Excel的最新版本塞滿了可視化工具,包括被推薦的圖表,不同方法迅速分析并展現數據,有多重控制選擇來改變和布局可視化。
主要特點:
l 在同一個程序里運行數據分析并且創建可視化
l 數據多種展現的方式進行比較
l 改變平鋪、布局和其他格式選擇
l Excel推薦數據最好的可視化方式
l 能夠兼容Microsoft Office產品
費用:
l Office 365 Home – 每年$99.99或每月$9.99
l ffice 365 Personal –每年$69.99或每月$6.99
l Office Home & Student 2016 – 永久購買$149.00
l Office 365 Business Essentials – 每個用戶每月$50(每年義務)
l Office 365 Business –每個用戶每月$8.25(每年義務)
l Office 365 Business Premium – 每個用戶每月$12.50(每年義務)
18. Modest Maps對于想要將交互地圖放進應用程序的開發者而言,Modest Maps是一個免費的而且能夠擴展的庫,由Stamen, Bloom,和MapBox合作開發。
主要特點:
l 用于為基礎構建映射工具
l 用于少數擴展程序,例如MapBox.js, HTMAPL和Easey
l 保護基本控制的設計
費用:免費
19. CartoDBCartoDB允許你在數分鐘內上傳并視覺化數億個數據值。它還具有地理空間分析功能探索、改進,并從您的數據獲得的見解。
主要特點:
l 探索數據并獲取見解
l 直接在地圖上編輯數據
l 與PostGIS 兼容的更強大的分析
l 先進版本的CartoCSS
l 支持柵格數據和矢量數據
費用:
l 免費—無限數據集/4層地圖層,,250MB矢量數據,每月1000條推特
l 基礎版-每月$149,無限數據集/5層地圖層,500MB矢量數據,每月10000條推特,同步表格,私人地圖,可移除標識
l 專業版-每月$449,無限數據集/6層地圖層,1.5GB矢量數據,每月250000條推特,同步表格,私人地圖,可移除標識
l 企業版-每月$825,無限數據集/6層地圖層,5GB矢量數據起步,每月250000推特,同步表格,私人地圖,可移除標識
20. Google ChartsGoogle Charts提供大量數據可視化格式,從簡單的散點圖到分層樹地圖。可視化效果是完全個性化的,你可以通過動態數據進行實時連接。
主要特點:
l 谷歌利用同樣的圖表
l 將多個圖表組裝成直觀的儀表板
l 兼容多個瀏覽器
l 多個平臺可使用(IOS和安卓設備)
l 從各種圖表中選擇
費用:免費
21. Gephi // @GephiGephi是能在Windows、Linus和Mac OS系統上運行的開源應用程序。該平臺允許用于可視化和探索數據,包括復雜的線性分析、社會網絡分析等其他深入了解數據關系的模型。
主要特點:
l 插件更加個性化
l 深層數據分析來檢測關系
l 內置的 3D 渲染引擎
l 實施視覺化
l 動態過濾
l 有內置的直觀的工作量組織界面
費用:免費
22. FlareAdobe Flash Player里可以運行的創建數據可視化的ActionScript庫,Flare是一個開源應用程序,由一些知名組織和出版商使用,來創建強大的可視化圖,包括Slate、IBM Visual Communication Lab和ABC News。
主要特點:
l 處理復雜、交互式圖表
l 支持數據管理、視覺編碼、動畫和交互作用
l 各種可視化表格從時間線到多層圖表來說明關系
費用:免費
23. Envision.js用Envision.js庫創建快且交互式HTML5可視化,能夠展示實時數據、時間序列、財務可視化、AJAX驅動財務圖表和自定義可視化,包括分形。
主要特點:
l 內置各種圖表和圖形的模板
l 將可視化效果、交互作用和自定義組件一體化
l 自定義圖表層類型
費用:免費
24. Miso開發中的一個開源工具,Miso合并數據集、故事版和d3圖表來創建交互式故事和數據可視化效果。Miso是The Guardian和Bocoup的聯合項目,得到Global Development、The Bill和Melinda Gates Foundation的支持。
主要特點:
l 高質量交互式故事
l 數據可視化內容
l JavaScript 客戶端的數據管理和轉換庫
l 運用D3.js創建可重復使用圖表
費用:免費
25. The R ProjectR Project是在UNIX、Windows和Mac OS上運作的統計計算軟件。設計的目的是用于統計計算和統計制圖,它考慮了不同應用的S語言,也包含了一些本身的S代碼,在R里沒有改變,雖然也有一些顯著的不同。
主要特點:
l 數據處理、計算和圖表展示
l 用于即時分析的集成工具
l 條件、 循環、 用戶定義的遞歸函數和輸入/輸出設備
l 定義新功能來增加兼容性
費用:免費
26. Tableau Public // @TableuTableau是一個簡單的、使用友好的用來迅速創建交互式可視化數據,并將它們嵌入你網站的工具。設計的目的是能由開發者、或無開發經驗的人使用,例如博主、記者、研究員、律師、教授和學生。
主要特點:
l 可以網上使用,或者下載并處理可視化
l 桌面端完整版應用程序圖片可以在公共服務器進行儲存
l 存儲數據空間有50MB(免費計劃)
l 拖拉式界面,不需要編程技巧
費用:
l 公共版本-免費
l 個人版本-每個用戶$999
l 專業版本-每個用戶$1999
27. Timeline JS // @knightlabTimeline JS3Timeline JS作為開源工具能夠從多重資源中提出媒介,運用40中不同語言建立交互式時間軸。內置支持Twitter, Flickr, Google Maps, YouTube, Vine和其他應用程序,Timeline JS擁有大量功能,能夠進一步的拓展進行自定義安裝來兼容JSON。
主要特點:
l 運用Google Spreadsheet數據建立時間軸
l 上傳電子表格,并生成嵌入代碼
l 從第三方apps在時間軸里嵌入音頻、視頻
l WordPress插件
l 從JSON數據庫中填補數據
費用:免費
28. Quadrigram //@quadrigamQuadrigram使用戶能夠創建自定義可視化效果,運用他們的數據和來自內置里圖表、圖形等各種組件來quadrification 和疊流?;诳梢暬幊陶Z言(VPL),Quadrigram是能從多個數據源提取并創建不斷變化的原型和數據可視化效果。
主要特點:
l 完整的交互式可視化庫
l 建立動畫、儀表盤或更多其他的
l 草圖想法和創建快速原型
l 基于云計算的快速數據處理
l 集成R 和 Gephi 的服務端
l 利用多個公開發布的數據集
費用(價格轉換自歐元):
l 學術版-每月$6.43(1個用戶,100MB存儲量)
l 個人版-每月$20.38(1個用戶,3GB存儲量)
l 專業版-每月$63.27(3個用戶,10GB存儲量)
l 工作版-每月$267.02(20個用戶,100GB)
l 企業版-聯系報價
29. PrefusePrefuse是一個數據可視化工具,IBM視覺傳播實驗室用于該公司Many Eyes工具來創建可視化效果。Prefuse軟件包為JavaScript提供了可視化框架,而Prefuse Flare工具包為ActionScript和Adobe Flash Player提供了可視化和動畫化工具。
主要特點:
l 數據建模、數據交互化和可視化
l 為各種視覺布局進行數據結構優化
l 支持動畫化、動態搜索和數據庫連接
l 使用Java 2D圖片庫
費用:免費
30. Many EyesMany Eyes是由IBM研究所和IBM Cognos軟件小組的試驗成果。該工具提供了一個平臺,用于創建各種可視化效果說明數據點關系,比較的值集,創建線性和堆棧圖、分析文本,或查看整個餅圖或樹圖中的各個部分。
主要特點:
l 多種方式展示數據
l 上傳供公眾使用的數據集
l 運用Java和Flash展示數據
l 通過用戶打分收集反饋
l 完全的控制或刪除你的數據集和可視化圖
l 使用其他用戶現存的數據集或者你自己的數據
費用:免費
31. Cytoscape // @CytoscapeCytoscape能夠合成不同屬性的數據形成可視化的復雜網絡。針對特別領域分析的功能,例如生物信息學、語義網和社交網絡分析,Cytoscape具有這些功能,并能創建鄰人著迷的圖表來表示數據之間的關系。
主要特點:
l 問題領域的應用
l 先進的分析及應用程序進行建模
l 人力策劃數據集進行可視化
l 可視化社交網絡中的人際關系
l 與其他工具一起聯合使用(例如R、NetworkX)
費用:免費
32.NetworkXNetworkX基于Python編程語言,能夠創建圖表、有向圖和多種多媒體格式合成的重圖。Python是用于創建多種交叉兼容的數據可視化的多平臺語言。
主要特點:
l 學習結構、動態和復雜網絡功能
l 節點能夠包含任何媒介類型,例如圖像和XML
l 邊緣能夠包含任何數據,例如加權或時間序列
l 多種圖表類型生成器,包括經典的曲線圖、隨機圖和合成網絡
費用:免費
33. Arbor.jsArbor由網絡工作者和jQuery一起建立的,能夠運用畫布、SVG或是HTML定位元素來創建數據可視化的工具。Arbor旨在幫助開發者創建強調他們數據集唯一性而不是需要各種布局的物質性。
主要特點:
能夠處理實時色彩和價值充斥
力導向布局圖增加了抽象性
實際屏幕繪圖由用戶做出
費用:免費
34. iCharts // @iChartsiCharts是基于網絡端的應用程序能夠在網頁上生成引人注目的數據可視化工具。這種云本地應用程序工具是“是為企業云應用內置的唯一數據可視化平臺”。將圖表和圖形集成到網站/應用程序或通過社交媒體或iCharts圖表頻道分發完成可視化。
主要特點:
l 運用公司的logo進行品牌視覺化
l 為了更好的發現增加標簽或描述
l 啟用第三方網站重新嵌入可視化來擴大范圍
l 數據是實時的
l 創建交互式、探索性圖表
l 領先一代的激活自制表格
l 分析報告在圖表視圖、共享和嵌入
費用:
l 基礎版-免費(僅限公共圖表)
l 網絡套裝可視化報告和分析-每個用戶每月$64.95
l 銷售團隊可視化報告和分析-測試版本請電聯
35. Databoard來自谷歌的工具,Databoard是Think平臺的一部分,主要面向企業主。探索見解直接來自谷歌調查研究,來迅速的查找數據并且創建自定義的信息圖表來嵌入網站或在社交網絡上分享。
主要特點:
l 探索谷歌數據調查研究
l 直接生成圖表元素
l 通過合成多種元素建立自制圖表
l 主要專注移動數據
費用:免費
36. Q Research Software // @qstatistics對于研究和數據可視化而言都是一個強大的數據庫,Q Research軟件時一個用于準備市場研究報告的工具,全是有價值的見解和可視化效果。以圖表格式、CSV文件和PDF文檔輸出到Word、Excel和PowerPoint,并且從一大堆工具/元素中選擇進行自制可視化效果。
主要特點:
l 可編輯的Office圖表
l 多種圖表類型(線性、氣泡、餅圖、列圖等)
l 直方圖和散點圖
l 利用實時數據更新圖標
l 創建變量值,應用過濾器,進行統計檢驗
l 強大的分析包括對應分析、logit分析、潛在類別分析、回歸分析、Max-diff分析,隨機參數分析、Kruskal Shapley、TURF分析等
費用:
l 30天免費試用期
l 標準授權許可 - 每年$1,499(所有功能)
l 可轉讓授權許可-每年$4,497(在多臺計算機上安裝)
37. Dapresy // @dapresy專為研究分析師設計,Dapresy允許用戶運用簡易使用的拖拉界面建立為他們的幻燈片和儀表盤建立信息圖表。Dapresy是一個綜合性平臺能夠處理整個報道過程,從數據分析到視覺上具有吸引力的展示工具和儀表板。
主要特點:
l 簡單的引入實地文件,Dapresy能夠處理數據
l 圖、表、交叉分析表和綜合統計分析
l 為市場儀表板建立動態元素
l 從200張幻燈片里打包數據為較少動態Dapresy幻燈片
l 靈感創意箱
費用:電話聯系報價
38. Visualize Free基于商用可視化的工具InetSoft,Visualize Free是一款免費的替代方案,使您可以通過幾個簡單的點擊來對多個數據集和變量進行篩選,確定趨勢和處理數據。
主要特點:
l 用Excel或CSV格式上傳你的數據
l 拖放元素來建立可視化效果
l 沙箱技術用于數據分析
l 公眾或私人分析
費用:免費
39. Jolicharts // @JolichartsJolicharts將圖表和表格嵌入你的應用程序里,能夠兼容多種數據源并處理連接多種數據源的復雜性。利用集成的彈性計算能力,Jolicharts能輕易處理大數據。
主要特點:
l 拖放界面創建令人驚嘆的儀表板
l 輸出儀表板XLS、PDF或JPG格式
l 過濾器來確保各個用戶的數據
l 基于Rest端的API能夠兼容任何應用程序
l 云端應用保證你的數據和可視化的可獲得性
l HTML5儀表板能在任何設備上獲得數據
費用(歐元轉換的價格)
l 永遠免費計劃-免費(50MB數據存儲量,單一用戶,展示不受限制,每個展示有一個數據源)
l 專業版-每月$31.13(10GB數據存儲量,增加到5個用戶,展示/數據源不受限制)
l 企業版-每月$74.06(250GB數據存儲量,增加到5個用戶,用戶/展示/數據源不受限制)