在不久的將來,我們將迎來大量集合了分布式處理、機器學習以及分析等當下各項熱門定制化解決方案的“預打包”式應用程序。
在過去的幾年當中,我們一直在積極討論大數據,而這一切的推動要素正是當初的Hadoop與現下的Spark。下一輪熱點將圍繞著將機器學習引入大數據展開,但如果不繼續使用上述熱門詞匯、我們仍然很難讓人們接受AI與分析技術方案。
事實上,大數據時代目前正迅速走向其生命周期的終點。大家可能已經發現,各大媒體關于大數據技術的相關報道正不斷減少——在我看來,這意味著Gartner著名的炒作周期已經由此走向低價甚至幻滅。
時至今日,大數據概念已經步入“終結”的轉折點,但這項技術的實際應用卻將由此開始興起。
對于整個業界而言,這意味著“讓我們先推出相關平臺,再觀察其實際效果”類項目將越來越少。決策制定者們將采取更為合理的方案并以實際業務問題作為切入點——這顯然更符合科學實施思維。換言之,即使是平臺供應商自身也開始更多地著眼于“解決方案”。
針對特定問題的標準化解決方案
接下來的另一項重要步驟在于分析問題、找出模式并創建能夠切實解決這些問題的打包解決方案。
我們已經親眼見證金融業界的不少企業對各類分布式欺詐檢測方案進行打包并加以運用。欺詐檢測軟件并不算什么新鮮事物,但將其分布至Hadoop以及 /或者云規模之下卻是種前所未見的新思路。當然,盡管金融行業的行動速度很快,但欺詐活動的組織者同樣在與時俱進。多年以來,金融業界一直無法真正追及惡意活動者們的發展節奏。但現在,他們有了發起反擊的必要武器,而Hadoop、Spark以及其它現代化工具將成為其軍火庫中最值得信賴的新儲備。
單純采用下一代技術方案還不足以讓定制化解決方案擁有應對一切的能力。面向信用卡的欺詐檢測機制與其它發票開具、保險乃至各類常見商業應用其實并無本質區別。下一波浪潮的核心并不是針對特定業界編寫出專用性極高的應用程序,而是思考如何利用“分布式大數據模式”解決跨多種現有業務線的各類常見問題。
當然,構建一套定制化解決方案以幫助每一位使用者以不同方式解決類似問題的作法仍將持續相當長的一段時間。不過未來我們需要逐步找尋具備共性的開發模式,并將其推廣至各個業務線當中——具體而言,以規?;植挤绞竭\用這項新技術,將其拓展至能夠帶來經濟優勢的規模并在排除盲點之后加以部署。最終,我們將成功實現定制化調整,使用正確的表述并加入必要調整,但同時又要保證軟件當中的接入算法不需要在面臨不同具體問題時進行反復重寫——這才是大數據技術的終極實現目標。
我們此前已經經歷過類似的狀況。幾十年前,財會軟件就曾經是一類熱門話題。雖然大家仍然會偶爾接觸到特定業務領域的專用性財會軟件,但多數大型企業都在使用打包式解決方案,其中只有特定部分進行定制或者利用插件解決不同行業內的特定需求。經驗豐富的CIO及CTO很少為特定某套業務線編寫專用的財會工具包,并將其適用范疇限定在單一企業當中。他們更傾向于購買現成產品,即使可選方案的種類并不是非常豐富。
下一次巨大飛躍將表現為“數據驅動”形式,并將“機器學習”技術引入到一系列軟件包的購買及獨立功能集成當中。從后端角度出發,整個流程也許將由大數據驅動,但“大數據”本身就像是以太網卡:它將成為一個前提性、但卻不再熱門的常規性技術議題。
原文鏈接:http://www.infoworld.com/article/2907872/big-data/big-data-is-dead-long-live-big-data.html?nsdr=true