2016年7月13日,Gartner公司新發布了2016年《數據倉庫和分析型數據管理解決方案關鍵能力》(Critical Capabilities for Data Warehouse and Data Management Solutions for Analytics)報告,該報告由分析師Rick Greenwald、Mark A. Beyer和Roxane Edjlali共同撰寫,共對19家數據庫廠商進行評估,是2016年2月25日Gartner公司《數據倉庫和分析型數據管理解決方案魔力象限報告》(Magic Quadrant for Data Warehouse and Data Management Solutions for Analytics)的姊妹篇。
該報告基于現有客戶經驗的調查數據評估供應商的能力,幫助數據集成和數據分析負責人選擇正確的技術發展信息基礎設施,以支持多樣化和發展的分析需求。
Gartner這份報告中的分數表示供應商在市場中的地位,當然這些分數都不是絕對的,只能說明在某份具體年度報告中的情況。在今年的研究報告中,對其他數據類型的支持的變化以及調查結果和分析師的研究之間的平衡已受到影響。
Gartner公司將“關鍵能力”(Critical Capabilities)定義為“在質量和性能上使某類產品/服務形成差異化優勢的屬性”。該研究報告圍繞傳統、操作、邏輯和上下文無關的四大數據倉庫使用案例對各廠商進行評估。
關鍵能力用例圖圖1 傳統數據倉庫使用案例的供應商產品分數
圖2 操作數據倉庫用例的供應商產品分數
圖3 邏輯數據倉庫用例的供應商產品分數
圖4 上下文無關的數據倉庫用例的供應商的產品分數
在傳統數據倉庫使用案例評估中(圖1),Teradata獲評最高產品得分。Teradata提供數據庫管理系統解決方案,數據倉庫設備以及云數據倉庫解決方案。其產品包括傳統和邏輯數據倉庫解決方案,這是Teradata所說的統一數據架構(UDA)的一部分。
Teradata在操作數據倉庫用例方面的得分也比較高,居MemSQL和IBM之后的第三位。三分之二的Teradata受訪者使用該公司操作數據倉庫用例的產品。
在操作數據倉庫用例的供應商產品分數(圖2)評估中,MemSQL獲得最高分。今年MemSQL位列操作數據倉庫用例榜首,在很大程度上基于連續數據加載和操作型BI查詢用例的調查得分。
MemSQL結合基于磁盤的列存儲分析,為使用案例提供了一個內存中的數據庫管理系統。從用戶的角度來看,MemSQL客戶報告的平衡允許它在數據科學實驗室設置專門高級功能,這對數據科學家和數據挖掘家更有利。但MemSQL客戶沒有足夠的經驗應對升級或版本遷移帶來的困難。
有三分之二的Teradata受訪者使用該公司操作數據倉庫用例的產品。越來越多的Teradata應用與Aster和Hadoop相結合,進一步證明了采用Teradata邏輯數據倉庫和上下文無關的數據倉庫用例的比例依然較高。
在四大數據倉庫使用案例類型評估中,除了Teradata和MemSQL有亮眼表現,Oracle、IBM、MapR等供應商的產品也分別位居各項評估分數前列。
傳統的數據倉庫用戶在今年的關鍵能力計算中,業務分析師和臨時用戶被歸類為傳統的數據倉庫用戶,而數據科學家和數據挖掘家被歸類為發現用戶。
今年,Gartner依舊定義了四種基本類型的用戶技能集:
數據科學家:統計專家,抽象數學,編程,業務流程,溝通和領導能力。
數據挖掘:數據專家,統計軟件,統計模型,充分意識到計算機處理的“陷阱”或錯誤。
商業分析師:利用聯機分析處理和三維工具來創建新的對象,用計算機語言和計算機處理技術。
臨時用戶:定期使用門戶和預置接口,最小可設計三維分析(如果有的話)。
數據倉庫四大用例傳統的數據倉庫
這個用例涉及管理來自不同結構源的歷史數據,數據主要通過批量加載。
傳統的數據倉庫可以管理大量的數據,主要是用于標準的報告和儀表板。它也用于自由形式的查詢和挖掘,或操作查詢,但它需要較高的系統可用性和管理能力。
業務數據倉庫
此用例管理在應用程序中不斷加載的結構化數據,支持應用程序中的嵌入式分析、實時數據存儲和操作數據存儲。
這種情況下,主要是支持報告和自動查詢,并需要高可用性和災難恢復能力,以滿足業務需求。管理不同類型的用戶或工作負載,如專案查詢和挖掘。
邏輯數據倉庫
此用例管理結構化和其他數據類型的數據種類和數據量。
除了來自事務性應用程序的結構化數據,還包括其他內容的數據類型,如機器數據,文本文檔,圖像和視頻。由于附加的內容類型可以驅動大數據量,管理大容量是一個重要的標準。邏輯數據倉庫還需要滿足不同的查詢功能,支持不同的用戶技能。這種使用的情況下,可以支持查詢其他來源的數據,并不僅僅是來自數據倉庫的數據庫管理系統。
上下文無關的數據倉庫
它表明了新的數據值,數據形式的變體和新的關系。它支持搜索,圖形和其他先進的能力,以發現新的信息模型。
這種使用的情況下,主要用于自由形式的查詢,預測建模或數據挖掘,以及支持多個數據類型和來源的查詢。它沒有業務要求,并有利于如數據科學家或業務分析人員等專業人士,可以實現多個數據類型的自由形式的查詢。