當下,圍繞大數據開展的研討與座談數不勝數,但似乎很少有人會把關注焦點放在支持大數據所必需的基礎設施身上——這一點在實際應用層面甚至尤為明顯。
對于大多數企業而言,大數據意味著為長年維護且塵封已久的數據倉庫配備一道訪問的大門。數據倉庫過去一直是、未來也將仍然是企業級機構所不可或缺的關鍵性組成部分。
這類系統的作用是將企業方方面面產生的數據匯聚起來,然后分門別類加以劃分,最終讓這些紛繁復雜的信息成為業務分析師深入了解企業運營狀況的寶貴資料。
一套針對可擴展性而精心設計出的基礎設施正是大數據能否真正發揮作用的關鍵所在。
經過分析與處理、能夠應用于實踐指導的信息數據會被整理到數據中心、應用程序以及基礎設施當中,企業管理者需要以此為基礎進一步將其導入各類系統及業務流程,并最終獲得(近乎)實時的決策能力。
然而數據倉庫在設計之初并沒有考慮到如此規模的整合及訪問狀況,目前也沒有任何一款商務智能系統足以幫助其解決這一難題。
數據的產生速度如此之快,常常會瞬間壓垮支持系統的處理能力。此外,大量系統對數據源發起的訪問同樣難于招架,管理應用根本不可能抵抗得住此等量級的資源需求攻勢。
要想讓大數據在企業中成為可資業務及運營所利用的成功平臺,IT部門必須首先對自己的數據中心資源進行有針對性的二次規劃。換言之,為了確保原有系統能夠應付即將到來的訪問及查詢需求,我們不得不面臨一次漫長而充滿艱辛的基礎設施及架構變革。
我們已經針對大量公開應用的擴展性配備了強大的基礎架構,現在要想讓大數據發揮理想中的作用,我們也需要拿出同樣的合理化方案——正所謂積跬步而至千里,從每周到每天再到近乎實時,我們所做的所有努力都會在大數據的響應速度方面得到明確回報。這就是我們理想中所需要的下一代數據中心架構,這一目標的實現也必將給企業在經濟價值上帶來又一次新飛躍。
數據檢索面臨的阻礙
可靠性是企業業務環境的根本訴求,這一點在基礎設施身上表現得更加明顯。但服務與基礎設施及應用的整合往往面臨巨大阻礙——當系統嘗試從服務中檢索數據時,通常都會遭遇無法實時獲得響應的窘境。這時系統只能選擇等待,直到本次任務流程完成或者宣告失敗。
在服務運轉良好時,這種小小的阻礙倒還可以忍受。數據檢索會(幾乎)立即獲得反饋,流程也將繼續進行。然而當服務運行本身就有些力不從心時,與之相關聯的系統很可能為了等待響應而陷入停滯。
這種延遲效應會干擾到整個業務鏈——從服務自身到相關系統,并最終影響終端用戶。作為終端用戶,顯然成了這次故障的最大受害者——由于系統常常隱藏于眾多架構服務層之下,他們根本無從得知系統為何沒能正常響應。
因此,大數據系統的可靠性及性能表現就成了我們要解決的核心問題。一套針對擴展性做出合理設計的架構能夠承擔起保障各層間連通性的重任,有了它的幫助,大家才能夠為自己的企業豎立“大數據能手”的良好口碑。
綜上所述,目前我們只有經歷漫長的調整周期才能讓現有結構框架獲得必要的可擴展能力,但這種能力正是大數據普及道路上的必要推動力。