商業(yè)信息(BI)市場的競爭很激烈且環(huán)境很擁擠。歷史上,大型企業(yè),如甲骨文和IBM,它們參與了功能大戰(zhàn),以圖證明精打細算(如果不是超出預算的話)的定價的合理性,并且嚴重依賴于高接觸的推銷手段。更糟糕的是,供應商希望你的IT部門與供應商自己的顧問合作來配置他們的產品,并將其與你的每個記錄型系統(tǒng)集成在一起,這往往需要額外的成本。
一旦安裝并運行傳統(tǒng)的商業(yè)智能系統(tǒng),管理人員必須等待每周或每月的行業(yè)報告,這意味著要一個月的時間來做決策,外加一個月的實施時間。添加一個報告需要向進度嚴重落后的IT提出請求,而這可能需要數周或數月的時間來進行設計和編碼。
這一切都隨著2004年推出的自助式商業(yè)智能而改變,例如我將在這個比較中介紹的五個平臺—Domo、Power BI、Qlik Sense、QuickSight和Tableau。自助式商務智能的過渡部分得益于在幾天而不是幾個月內做出商業(yè)決策的能力。最近,云計算和高速互聯(lián)網接入已成為自助式商業(yè)智能的關鍵技術驅動力。
當然,傳統(tǒng)的商業(yè)智能雖然有所衰退,但依然活蹦亂跳。財報尤其要求100%的準確性,這通常需要數周才能生成報告。報告可能是一個單獨的用例,它也許并不能一直得到自助式服務的商業(yè)智能產品的良好服務,后者強調交互式視覺發(fā)現,盡管一些較新的平臺試圖完全取代傳統(tǒng)的商業(yè)智能系統(tǒng)。
同時,傳統(tǒng)的商業(yè)智能平臺也在不斷發(fā)展。有些已經增加了足夠的自助式服務、可視化發(fā)現和分析,以滿足現有客戶的需求。
挑選自助式商業(yè)智能平臺的標準
在你選擇自助式商業(yè)智能平臺時進行自己的評估是很關鍵的,因為很多供應商推出的功能可能沒有為你的企業(yè)帶來真正的好處。例如,如果貴公司已經擁有高性能的數據湖(data lake),那么你可能不希望支付將所有數據導入自己的商店的商業(yè)智能平臺的差價。同樣,你可能更傾向于將商業(yè)智能系統(tǒng)集成到現有的協(xié)作平臺,而不是使用專用的商業(yè)智能協(xié)作功能,因為要求員工使用兩個協(xié)作系統(tǒng)的做法通常是不會成功的。
如果你的大部分數據都在Azure上,那么你可能需要排除僅在Amazon Web Services上運行的商業(yè)智能系統(tǒng),反之亦然。如果可能的話,出于性能上的理由,你希望將數據和分析合并在一起。
供應商傾向于引用對他們的產品最有利的分析報告。不要信任供應商的一帶而過的摘要,或者輕信他們向你展示的圖表:向他們索取并閱讀整個報告,這個報告會提及注意事項、劣勢、優(yōu)勢和特性。還要以懷疑的態(tài)度來對待分析師的報告中夾帶的私貨:大多數大型分析公司對付費的客戶更感興趣,而不是非它們的客戶的供應商,盡管個別分析師的真誠嘗試是公正且中立的。
以下是評估自助式商業(yè)智能平臺時的七個關鍵領域的問題。
數據源
你要確保商業(yè)智能平臺可以讀取所有數據源。其次,你要知道平臺在處理數據前是否必須將數據導入到自己的工場中,或者是否可以即時處理數據查詢。
如果必須導入數據,分析速度是否足夠快,以證明花時間導入是合理的?商業(yè)智能系統(tǒng)能否自動更新原始數據源的數據?
如果商業(yè)智能系統(tǒng)中的數據存儲要收費,請盡情猜測5年內你將擁有多少數據,并將其數量增加三倍。存儲該金額的成本是否會影響你的預算?
另一個關鍵問題是:商業(yè)智能系統(tǒng)是否可以在你存儲數據的地方運行呢?如果不可以,遷移數據的難度有多大?
數據轉換
當你要收集數據時,數據往往是很“臟”的。行中可能缺字段,或者可能包含無意義的值。行中的多個字段可能具有相互不一致的值。文本字段可能包含拼寫錯誤、拼寫變體或術語變體,使其不能自動組合在一起。有些字段,特別是自由形式的評論可能會很長,而且用處不大。
此外,字段可能是非參數化的(如文本),為了分析的目的,需要將其編碼為數字,盡管有些商業(yè)智能系統(tǒng)在內部實現了自動化。字段的數字范圍可能有數量級的差異,需要將它們歸一化。可能一些值要從另一些值推斷出來,例如,如果源數據中不存在性別,可能需要從名字和/或標題中推斷出性別。
你可能要給商業(yè)智能系統(tǒng)編寫SQL SELECT語句,或者它可能自動導入自身。如果要編寫數據庫查詢,它是否可以幫助你選擇字段并創(chuàng)建連接(join)呢?
凡此種種的問題意味著你應該在你的一些數據上測試一個商業(yè)智能系統(tǒng)。構建一個提取/轉換/加載鏈,同時查看和繪制數據。看看它們顯現的難易程度。將其與其它商業(yè)智能系統(tǒng)進行比較。不要低估數據清理要花掉的時間,這多半會占用總分析時間的80%。
分析能力
你要以幾種方式分析已清理的數據。在最簡單的層面上,你將以各種格式繪制數據,并對歷史數據和趨勢進行直接的統(tǒng)計分析。除此之外,你要探究數據以了解特定的功能,并構建模型以測試你對原因的看法。最后,你可能需要根據統(tǒng)計模型甚至機器學習模型來預測未來的績效指標(例如銷售和庫存需求)。
你將遇到的一個功能大戰(zhàn)體現在所提供的圖表類型的數量。當吹的天花亂墜的圖表類型不適用于你的數據時,這通常是毫無意義的。另一方面,有些圖表類型非常重要:例如,我不愿意使用沒有地理顯示支持的系統(tǒng),因為查看位置表中的原始數據與查看地圖上不同的顏色或不同的氣泡大小的視覺和直觀影響是不同的。
另一個功能大戰(zhàn)是對分析的支持。是的,你確實應該具備在商業(yè)智能平臺內執(zhí)行簡單的統(tǒng)計的能力,至少要懂回歸模型。更深入的話可能會與用戶產生“阻抗失配”。
例如,將機器學習和深度學習支持添加到探索性商務智能分析的選項中,這對管理者和業(yè)務分析師而言可能是一個難以企及的目標。數據科學家則是另一回事,但他們通常具有專門的專業(yè)工作空間來創(chuàng)建機器學習(ML)模型和深層神經網絡,他們使用的工作流程通常需要統(tǒng)計知識和編程技能,而這些流程對他們在這方面的要求遠高于典型的商業(yè)智能用戶。
另一方面,自然語言支持和分析常見數據模式的內置智能使生疏的用戶更容易使用平臺。將機器學習應用于用戶體驗往往是好事,即便要求業(yè)務分析師訓練深度學習模型也許是徒勞的。
現在有些商業(yè)智能平臺使用內存數據庫和并行性來加速查詢。未來,你可能會看到更多高度并行化的基于GPU的數據庫被內置到商務智能服務——第三方正在建設這些展示了驚人的速度提升的數據庫。
你經常需要在分析過程中修改或增加數據轉換,例如通過添加反映其它列之間的差異或比率的列,就像財務分析中經常進行的操作一樣(如債務/權益)。這樣的修改有時可以改變ETL(提取,轉換和加載)管道到ELT(提取,加載和轉換)的導入過程。某些供應商僅支持ETL或ELT之中的一個,但大多數使用ETL的商業(yè)智能系統(tǒng)在分析步驟中都提供了額外的轉換。
易學易用性
盡管自助式商務智能系統(tǒng)是針對管理者和業(yè)務分析人員,但它是很復雜的,它有很多移動部件。在我嘗試過的商業(yè)智能平臺中,用戶體驗和學習資料的平臺間質量差別很大。在評估中試著讓技能水平參差不齊的用戶參與進來,以了解他們的反應。另外一定要測試文檔本身。最好的文檔搜索、索引和組織以及最差的文件之間存在巨大差異。有時候,我常常不得不要求銷售工程師在經歷重要但失敗的個人努力之后為我找一個教程。
演示的靈活性
有些商業(yè)智能系統(tǒng)幾乎對任何變量的選擇都顯示出算得上有見地的圖表。另一些商務智能系統(tǒng)等待你點擊你想要查看的圖表類型。如果你知道你的需求,那么用哪一種方法都可以,如果你不知道的話,最好是讓系統(tǒng)根據你選擇的變量的數量和種類提供幫助。
商業(yè)智能系統(tǒng)往往區(qū)分始終是數字的度量和可能是非參數化的維度。有些維度,例如城市、州和國家可以轉化為經度和緯度等度量。有時候,你想看到符合維度標準的度量,例如“按產品展示我們的利潤率”或“按店鋪顯示我們的同比銷售額”,以及另一些時候你希望看到符合其它度量標準的度量,例如,“向我展示利潤與中西部地區(qū)所有商店的銷售額”。
一旦你看到了一個有意義的圖表,你往往想放大特定的功能、調整顯示,并添加注釋。商業(yè)智能系統(tǒng)在這個領域的差異很大,所以做這個練習是值得的。
協(xié)作的選擇
你可以共享的具體內容因系統(tǒng)而異,或者按照你是否想要完全與授權用戶、只讀注冊用戶或未注冊用戶共享。在某些情況下,只讀用戶可以從你提供的圖表中對數據進行排序和篩選;在其它情況下,他們只能看到你的分析的幻燈片。
這個區(qū)別通常會影響你是否能夠為整個公司或只為特定的受眾提供商業(yè)智能產品,當然還有定價。
成本和收益
我所指的成本不僅僅是供應商的年費,還包括存儲數據的成本,將平臺托管在本地或云端的成本,還有人員培訓的成本。這樣做的好處包括減少勞動力和決策時間,做出更好的決策,并最終提高利潤并加快發(fā)展速度。
當今可用的最好的自助式商務智能工具
考慮到這些因素,讓我們來看一下五個引領市場的商業(yè)智能平臺(按字母順序排列)。
Domo
Domo是一個在線商業(yè)智能工具,它結合了大量數據連接器(data connector)、ETL系統(tǒng)和統(tǒng)一的數據存儲、大量可視化、集成社交媒體和報告功能。Domo自稱它不僅僅是一個商業(yè)智能工具,因為它的社交媒體工具可以產生“可行動的洞察”,但實際上每個商業(yè)智能工具都會產生有利于業(yè)務的行動,或最終被丟棄在垃圾堆的行動。
Domo是一個非常優(yōu)秀且功能強大的商業(yè)智能系統(tǒng)。它支持大量的數據源和大量的圖表類型,而且集成的社交媒體功能很棒(如果夸大其辭的話)。但是,Domo比Tableau、Qlik Sense、QuickSight和Power BI更難以學習和使用,專業(yè)版每年的費用為每用戶1920美元,企業(yè)版每年的費用為每用戶2280美元,它的成本高出好幾倍。
根據你的需要,Tableau、Qlik Sense或Power BI極有可能是比Domo更好的選擇。
Power BI
Power BI是微軟加入自助式商業(yè)智能戰(zhàn)場的產品,它包含了一個托管在Azure上的服務的Web界面和Windows桌面的Power BI Desktop應用程序。它的價格比競爭對手要優(yōu)惠:標準賬戶是免費的,專業(yè)賬戶每個月的費用是每用戶9.99美元,而Power BI Desktop是免費的。
網站和桌面應用程序都會定期更新。Power BI Desktop每月更新一次;網站更新后很難看出區(qū)別。
對于某些數據源,Power BI具有預定義的圖表,儀表盤和報表。例如,默認的Visual Studio Online儀表盤和報告提供了Git、拉取請求和版本控制活動、在你為你的賬戶配置的項目之間的一目了然的視圖。對于其它來源,Power BI預計會看到其數據的某些標記。例如,它支持Excel工作表命名表,Excel數據模型表和Power View工作表。如果在Excel工作表中只有原始數據,則需要返回并創(chuàng)建一個或多個命名表;如果你在導入前確保數據類型是正確的,它也會有所幫助。
對于使用Windows、Office和Azure生態(tài)系統(tǒng)的公司來說,Power BI是一個合理的選擇。對于那些希望為組織中的每個人提供商業(yè)智,對成本很敏感的公司來說,這也是一個不錯的選擇。缺點是Power BI不像Qlik Sense或Tableau那樣具備很多的分析功能或對圖表的控制權。
Qlik Sense
Qlik有“模式1”或在QlikView中有傳統(tǒng)的商業(yè)智能產品,并在Qlik Sense擴展了自助式商業(yè)智能。2014年問世的Qlik Sense是一款自助式商業(yè)智能和可視化產品,它基于與QlikView相同的內存關聯(lián)的數據索引引擎。在2016年,Qlik將之前僅在QlikView可用的報告引擎添加到QlikSense中。
Qlik Sense 2.0是一個非常強大的數據發(fā)現和交互式分析工具。它幾乎可以連接到所有的SQL數據庫,并且可以對可視化進行很好的控制。但是,它不像Tableau那樣易于學習、使用或靈活地呈現可視化效果。
商業(yè)智能的數據導入往往是一個混亂的過程。Qlik Sense 2.0會嘗試在不同的表中關聯(lián)相同的名稱的字段,還會比較數據并就類似字段提供推薦。這個新功能被稱為智能數據加載(Smart Data Load)。
Qlik Sense 2.0還引入了Qlik DataMarket,這是可用的公共和商業(yè)數據的來源,它可以分為六類:商業(yè)、貨幣、人口、社會、氣候和經濟。當你分析私人數據時,有公開數據的話會有很大的幫助。
Qlik通常以壓縮格式的形式將數據保存在內存中。然而,有時候你的數據多得無法存儲到可用內存中,在這種情況下,Qlik Sense可以使用“直接發(fā)現”模式將內存中的數據與數據庫中的數據相結合。在直接發(fā)現模式下,有些字段只能作為可在表達式中使用的元數據/符號表加載到內存中。駐留在數據庫中的實際數據將根據需要進行查詢。
使用Qlik Sense時,你可以將書簽保存到當前工作表的當前選擇狀態(tài),并且可以將書簽合并到故事中,并添加文本和其它注釋以使故事不言自明。如果你正在使用故事進行實況演示,你可以深入到任何可視化的源代碼來回答問題,然后在回答問題時返回到故事。
Qlik的關聯(lián)式綠白灰體驗,在這里所顯示的值的顏色指示狀態(tài)(已選—可選—不可選)有助于你發(fā)現相關數據和無關數據,而無需挖掘,這是一個很高明的手段。我也喜歡Qlik定義表達式的方法,但我更喜歡Tableau的方法。Qlik Sense可以很好地控制可視化的外觀,這一點比微軟的Power BI做得好,但又不如Tableau做得好。
QuickSight
亞馬遜的QuickSight完全運行在AWS云端,它對亞馬遜的數據源享有良好的訪問權限,能夠平等地訪問其它數據源,并以基礎價格提供基本的分析和數據處理。在這里討論的其它產品中,QuickSight與Power BI最像,只是前者沒有依賴桌面產品來創(chuàng)建數據集,或依賴Power BI Desktop / Service組合提供的分析能力水平。
QuickSight像Power BI、Qlik Sense和Tableau一樣連接到無數的數據源,并讓你準備數據集。一旦擁有了數據集,你就可以創(chuàng)建具有一個或多個可視化分析,你可以將其組織到儀表盤和故事中。你可以共享組織中的數據集、儀表盤和故事。QuickSight使這個過程非常簡單直接,但是它缺少一些有用的可視化功能。
公司中的第一個用戶永遠是免費的,有四個用戶的團隊可以免費試用60天。除試用版外,對于額外增加的用戶,標準版每月的價格為每用戶9美元,企業(yè)版每月的價格為每用戶18美元。
第一個QuickSight用戶可以獲得1G的SPICE(超高速并行內存優(yōu)化計算引擎,Superfast Parallel In-memory optimized Calculation Engine)存儲空間,而額外的用戶有10G的SPICE存儲空間。額外的SPICE存儲成本:標準版為每月每G要25美分,企業(yè)版每月每G要38美分。企業(yè)版增加了靜態(tài)安全數據加密,并連接到組織的AWS Active Directory。
SPICE是QuickSight的用于可視化的高性能內存數據存儲,從文件導入的數據必須要用到SPICE,而SPICE對于SQL數據庫中的數據來說則是可選的。每個SPICE表格的容量限制為10G。
對于在AWS上托管眾多數據源、分析需求和開發(fā)時間有限的工場,使用QuickSight似乎是一件想都不用想的事情。QuickSight增加了簡單的分析和可視化功能,但只是象征性收點錢。
Tableau
Tableau稱其產品能提供“以你的思維方式工作的分析”,并表示這些工具利用了“人們快速發(fā)現可視化模式,展現日常機會和靈感瞬間般的天生能力”。這有一定的道理,盡管這個道理在很多其它的商業(yè)智能工具上也說得通。
分析工作流程的可視化發(fā)現階段是最誘人的部分,但大多數人不該花大部分時間在這個地方。根據我的經驗,導入和調整數據可以輕易地消耗你花在一個商業(yè)智能產品上的80%的時間。
既然Tableau可以執(zhí)行跨數據庫連接,你可能會導入多個數據源并將其連接起來,如果貴公司大到(或者有錢到)需要Tableau,你可能會將大部分數據源托管在數據倉庫中。
然后,你要逐行過濾和調整數據。最后,你將真正地達到可以開始創(chuàng)建可視化對象的程度,盡管你在摸索時不得不執(zhí)行額外的數據轉換。但是Tableau能輕而易舉地完成數據調整和轉換,就像在Excel中一樣簡單。沒有必要返回到導入階段來添加計算好的字段或過濾數據。
Tableau中的可視化發(fā)現功能很強大,Tableau為其易用的實現和圖表顯示的精細控制設立了標準。通過單擊或拖動感興趣的尺寸(通常是離散類別或特性)和度量(數值),并自己選擇一個標記(顯示類型,如條形、線條和點),可以構建Tableau可視化,或使用自動標記選擇,或使用“顯示給我看(show me)”的方法來選擇可視化。
要進行更多控制的話,可以將維度和度量拖動到特定的標記特征或“擱架(shelf)”上。當你了解分析中發(fā)生的情況時,你可以與其他人共享儀表板和故事。這很容易通過將它們發(fā)布到Tableau Server或Tableau Online來完成,無論你是否使用Tableau Desktop,是否需要上傳,還是你已經在做在線分析。
Tableau的定價變得相當有競爭力,至少與Qlik和Domo相比是這樣的。個人版:每位用戶每月35美元;專業(yè)版:每位用戶每月70美元; Tableau Server:每位用戶每月35美元; Tableau Online(完全托管):每位用戶每月42美元。
不過,我必須指出,微軟的Power BI以Tableau的四分之一的價格提供了大約相當于后者80%的功能。當你考慮勞動力成本和公司利益時,你必須根據自己的情況來決定這筆帳是否經得起推敲。
版權聲明:本文為企業(yè)網D1Net編譯,轉載需注明出處為:企業(yè)網D1Net,如果不注明出處,企業(yè)網D1Net將保留追究其法律責任的權利。