大數據雖然是一座寶山,但并非有數據,就能產生價值。大同世界科技業務營運中心技術工程處處長張文祥指出,大數據的分析與應用,必須透過很多生態系統搭配組合,才能產生用戶所需要的資訊。
事實上,國際顧問研究機構Gartner在2015年所提出的十大策略性技術與趨勢,其中「無所不在隱于無形進階數據分析高居第四名,就可看出大數據分析的重要性。
任何新創技術的成熟度都非一蹴可及,而是要經歷科技誕生的促動期、過高期望的尖峰期、泡沬化的谷底期、穩健成長的光明期及實質生產的高峰期,許多新創技術在促動期就可能失敗,尖峰期則是發展的臨界點,如果能夠熬過谷底期,才能步入光明期及高峰期,而數據分析技術,目前正是已經步入谷底期及光明期的臨界點。
要掌握大數據分析的發展趨勢,首先要先了解大數據的核心,也就是「數據」的本質,如那些數據有助于解決特定的問題;如何、多久及何處取得數據;數據保存的型態及時間;數據要如何萃取;數據要如何藉由視覺化圖表或整合式數據予以呈現等。
了解何謂「數據」后,接下來就得了解大數據的叁大特性,思考其應用特性。包括數據量的規模(Volume):通常是以TB、PB等級的數據量為基本單位;數據異動的速度(Velocity):數據的時效性一旦錯過,可能就不具任何價值,在金融交易領域尤其明顯;多樣性(Variety):數據可能有各種型式,包括文字、影音、圖像、網頁、串流。
大數據的分析應用與傳統的關聯式數據庫結構化數據分析相較,超大量的半結構化/非結構化數據的儲存及分析,很容易造成其效能瓶頸。但若能根據數據特性,建構使用合適的數據分析平臺及分析工具,將能以最佳的性價比提供最具深度的數據分析,以洞悉資訊發揮其最大的價值。
大數據時代之所以到來,其與物聯網及云端運算的推波助瀾有相當密切的關系。引述Gartner的數據指出,不包含PC、平板及智慧型手機在內的物聯網裝置用戶數,將于2020年成長至260億臺,物聯網產品與服務供應商將創造逾3,000億美元的邊際收益,且絕大部分在服務領域,其各類終端市場的銷售業績,將為全球帶來1.9兆美元的經濟附加價值。
結合云端運算無遠弗界、隨取隨用的服務特性以及搭配大數據的探勘、分析與整合技術,讓業者得以大規模蒐集、傳遞、儲存及分析數據,以延伸更多深入應用,進而迅速擴大物聯網的規模及應用。但在此同時,其也間接深化推動云端運算與大數據分析的應用發展,3者共生共榮,缺一不可。
根據國外針對大數據解決方案所形成的生態系統的分析結果觀察,單單在數據架構平臺 、分析管理工具、跨數據平臺/分析工具、數據應用軟件、數據來源、開放技術等幾大類,就至少超過350家相關業者。
正由于大數據扮演如此重要角色,因此如何針對應用資訊服務并掌握其中核心技術,對于企業而言,將會是改變未來的關鍵力量。
新一代企業數據中心必須在兼具成本優勢,且快速滿足對RPO與RTO需求的前提下,能充分因應云端服務伴隨而來的大數據成長挑戰。考量數據應用于不同情境下,成長量、效能、服務等級及成本效益需求各有不同,其實很難用單一架構來滿足所有的數據儲存的需求。因此采用混合式數據儲存(Hybrid Storage)將會是其中的關鍵應用。
至于新一代企業儲存架構平臺該采用何種儲存技術,融合式數據儲存、云端儲存及水平擴充式儲存相當值得關注。
它們的共同點是藉由無遠弗屆的網路力量,打破數據處理與儲存的樊籬,采用分散式架構,支援上千個節點及Petabyte等級的數據量,并可搭配開放塬始碼軟件框架,不但擁有儲存與處理大量數據的能力,還可藉由平行分散檔案的處理,得到快速的回應,充分滿足大量數據分散式儲存與分析應用之需求。
其實傳統儲存系統、融合儲存、云端儲存及水平擴充儲存各有擅長,企業若能善用混合數據儲存技術及平臺特性,透過軟件定義架構 ,消弭不同應用平臺間的差異,將可提升快速回應與增加數據中心彈性,大幅縮小部署時間,并可藉由ITaaS及隨選服務,將可大幅提升使用彈性,成為企業可靠的數據儲存平臺。
企業若能針對商業智慧應用,善用前述技術建立新一代數據中心分析平臺,就能打通大數據分析的任督二脈,輕松駕馭大數據分析,細致打造高效率企業數據中心數據平臺。
原文鏈接:http://www.thebigdata.cn/YeJieDongTai/13944.html