IT領導者需要了解大數據帶來的機遇,以便他們能夠克服各種挑戰,在不斷增長的以數據為中心的經濟中保持競爭力。
數據的指數級增長促使研究人員尋找新的方式來觀察和分析世界。它是關于發現捕獲、搜索、共享、存儲、分析、呈現數據的新數量級。“大數據”就是這樣誕生的。大數據是在數字基礎上存儲大量信息的概念。
大數據是指非常大的數據集,傳統的數據庫管理或信息管理工具對其無法真正發揮作用。實際上,人們每天產生大約2.5萬億字節的數據。這些數據來自不同的平臺:人們發送的消息、發布的視頻、天氣信息、GPS信號、在線交易購物記錄等。這些數據稱為大數據或海量數據。雅虎、Facebook、谷歌等網絡巨頭是首先部署這種技術的公司。
雖然沒有大數據的具體或通用的定義。作為一個復雜的術語,大數據的定義根據社區、用戶或服務提供商而有所不同。跨學科方法可以了解不同參與者的行為:工具的設計者和供應者(計算機科學家),用戶類別(經理、企業主、決策者、研究人員)以及專業人士。
大數據是一個雙重技術系統。實際上,它既有好處又面臨挑戰。大數據的到來現在被許多文章描述為一場新的工業革命,類似于蒸汽機(19世紀早期)、電力(19世紀晚期)和計算機科學(20世紀晚期)的產生。另一些人則將這一現象描述為第三次工業革命的最后階段,實際上這是一個“信息時代”。在任何情況下,大數據都被認為是導致社會深層次變革的根源。
大數據在各行業組織的應用中越來越廣泛,而開展大數據項目并不容易。根據NewVantage Partners進行的一項研究,在接受調查的“財富1000強”的企業中,95%的企業在過去五年中實施了大數據項目,但只有48.4%的企業從這些項目中成功獲益。
以下是企業面臨的一些主要的大數據挑戰:
管理數據增長
顯然,要克服的最大的大數據挑戰之一就是存儲和分析所有信息。IDC公司估計,全球各地的計算機系統中存儲的信息量每兩年翻一番。大多數數據是非結構化的,這意味著它沒有存儲在數據庫中。而照片、文檔、視頻和音頻文件很難分析。
為了克服這個挑戰,企業可以使用不同的技術來管理不斷增加的數據。在存儲方面,融合和超融合的基礎設施以及軟件定義的存儲都證明可以使硬件易于擴展。壓縮數據、重復數據消除以及分層等技術還可以減少存儲大數據所需的空間和成本。在管理和分析方面,企業可以使用NoSQL、Hadoop、Spark等大數據分析軟件,以及商務智能軟件、人工智能和機器學習等工具來獲得所需的洞察力。
快速生成洞察力
企業不僅希望存儲它們生成的大數據,還希望使用大數據來實現他們的目標。根據NewVantage Partners進行的研究,與大數據項目相關的主要目標是減少開支,實施數據驅動的文化和創新,加速部署新功能和服務,以及推出新產品和服務。這些不同的目標可以使企業更具競爭力,但他們需要獲得洞察力,并迅速加以利用。
為了幫助他們快速實現,企業可以使用新一代的分析工具,顯著減少生成報告所需的時間。他們大量投資分析工具,幫助實時獲得結果。通過這種方式,可以盡快響應市場的發展。
招募大數據人才
為了開發和管理能夠產生見解的應用程序,企業需要掌握大數據技能的專業人員。事實上,對大數據專家的需求以及為他們提供的薪酬都在大幅增加。
為了解決大數據人才匱乏的問題,企業具有多種選擇。他們可以增加預算,招聘人才,并提供工作崗位。其他的選擇是培訓現有員工學習和掌握大數據,在企業內部培養大數據人才。最后,許多企業購買了自助分析解決方案或機器學習軟件,專為沒有數據科學背景的專業人士使用而設計。這些工具可以幫助企業克服大數據挑戰,并實現目標,甚至無需聘請大數據專家。
整合多種大數據源
各種各樣的數據使集成成為最大的數據挑戰之一。實際上,數據來自不同的來源:業務應用、社交網絡、電子郵件、員工文檔......將所有這些數據有效地結合起來,并使用它們來創建報告,對于高級用戶來說,數據驅動的洞察力和業務決策支持解決方案可能非常困難。為了解決這個問題,不同的供應商提供了集成工具,旨在簡化流程。然而,許多企業承認他們還沒有克服這一挑戰。
數據驗證
數據驗證也是大數據的主要挑戰之一。許多企業從不同的系統接收類似的數據,這些數據有時是矛盾的。
為了協調這些數據,企業必須使用數據治理。數據治理也帶來了各種挑戰,事實上,根據AtScale 2016“大數據成熟度調查”,數據流通量是受訪者表示增長最快的領域。
解決數據治理挑戰通常并不容易。它需要技術和政策變化的結合。但是,一些嘗試包括分配人員來監視數據并定義規則和過程。另一種選擇是投資數據管理解決方案,旨在簡化面向大數據準確性和存儲的數據治理。
保護大數據安全
安全性也是大數據領域面對的一個重要問題。商業數據可能對黑客具有吸引力。但是,根據IDG公司的一項研究,只有39%的公司對其數據存儲庫使用額外的安全措施。一些最主要的附加措施包括訪問和身份控制、數據加密和數據隔離。
組織面臨的挑戰
除了大數據挑戰的技術方面,員工還面臨大數據的挑戰。在試圖啟動大數據項目的企業遇到的主要挑戰中,三個主要問題是組織協調性不足、管理者缺乏理解、業務面臨阻力。
因此,要解決這一挑戰,必須讓商業領袖相信大數據的有用性,并任命一名首席數據官。同樣重要的是,企業的高管、董事和經理必須了解大數據帶來的機遇,以便他們能夠克服各種挑戰,并在不斷增長的以數據為中心的經濟中保持競爭力。