咨詢公司獲得了客戶關于Spark評價的 “實質性”調查。但這項技術尚未成熟,企業用戶中關于Spark集群的產品相對較少。他說,“我們對這項技術很感興趣,Spark是否轉化為部署是我們密切關注的事情。”
軟件公司Intuit和Novantas經過深思熟慮,決定部署他們的第一個Spark集群,限制初始用戶訪問并尋找堅實的商業用途。
Intuit公司建立了Spark集群,最初用于在網站和進入在線表單的數據用戶的財務和會計軟件分析點擊流記錄。但是Intuit的副總裁Bill Loconzolo并不打算使用開源數據處理引擎。
Loconzolo表示,在他的印象中,Spark似乎并不是很靈活。但是盡管Spark集群設置是實驗性質的,數據科學家團隊也可以使用。Loconzolo說,2016年年底之前,他不打算開放系統。
他想要建立一個基于Cloudera公司Hadoop分布的大數據分析架構,他準備使用Spark等新技術至少六個月,以便判斷公司是否做好了準備。
“以前使用大數據技術時,我們有過類似的教訓,”他解釋說,“有時候,提前做準備是我們避免失敗的有效方式。”
Novantas公司的首席技術官和工程主管Kaushik Deka表示,開始使用Hadoop時,他的團隊也采取了非常謹慎的戰略模式。
“一年前,我們從未使用過大數據平臺,”Deka說,“我們完全認同這樣的技術,但想要使用這些技術,公司內部文化需要做些真正的努力和轉變。”Novantas還必須通過對現有員工進行培訓,建立像Spark一樣的內部專業工具。
為了避免偏離軌道,該公司非常謹慎地尋找一個堅實的初始業務用于大數據技術。達到搜索高峰時,銀行利用其分析服務和軟件結合不同的數據集來支持個人客戶如何應對市場營銷的預測模型。Spark非常適合該應用程序,可以作為一個引擎完成提取、轉換和加載數據集成工作。
Gartner分析師Nick Heudecker說,咨詢公司獲得了客戶關于Spark評價的 “實質性”調查。但這項技術尚未成熟,企業用戶中關于Spark集群的產品相對較少。他說,“我們對這項技術很感興趣,Spark是否轉化為部署是我們密切關注的事情。”