大數據研究領域可謂炙手可熱,然而對數據中的價值加以利用仍然充滿挑戰。今天,我們將對此類挑戰進行詳盡解析。
大數據的生成速度令人錯愕,事實上90%的可用數據是在過去兩年當中才剛剛出現。如今我們需要努力分析大數據,從而發現其中可用以指導決策及戰略性業務轉型的洞察結論。
大數據應用已經開始在改進產品、提升服務水平及客戶服務等領域發揮作用。下面來看一組具體數字:只有17%的企業尚無任何計劃建立大數據項目,而超過70%的企業已經開始使用大數據——包括將其整合至業務當中,或者作為試水性項目。數據技術正在逐步成熟,亦有越來越多組織機構準備將其納入信息管理與分析基礎設施當中。
然而,以下大數據帶來的“大挑戰”同樣不容忽視。
找到用于交流大數據的語言
各類科學,包括化學乃至數學都憑借著一種特定語言的出現而獲得巨大的推動作用。很明顯,我們必須在大數據找到同樣值得依賴的特定語言,從而像使用代數符號以及合適的編程語言那樣更好地對其加以分析。
提升數據可靠性
隨著可用數據量的不斷增長,我們必須有效區分“數據”的“信號”以及“有價值信息”。遺憾的是,截至目前仍有很多企業難以找到最理想的數據以及具體使用方式。這區分“垃圾數據”與保障數據質量已經成為一大關鍵性難題。
數據訪問
數據訪問與連接性同樣是一大障礙。麥肯錫公司調查顯示,目前仍有大量數據點未能接入網絡,因此企業往往還不具備管理整體業務所必需的數據平臺。
將更多復雜數據納入進來
如果說大數據的起步階段是在同“簡單”數據作斗爭(例如數字表以及圖形等),那么如今需要處理的數據正變得愈發復雜:圖片、視頻以及對物理乃至生活環境的描述等等。因此,我們有必要重新審視并構建大數據工具及架構,用以捕捉、存儲并分析多樣性數據。
更好地整合時間變量
時間維度亦是大數據發展中的一大重要挑戰,即如何分析長期因果關系,而不僅僅是處理實時數據流。最后,這一問題亦會給存儲領域帶來挑戰。我們需要認真選擇以切實承載如此龐大的數據存儲量。
IT架構
數據世界的技術環境正在快速發展,因此能夠有價值數據的前提在于同擁有強大創新能力的技術伙伴開展合作,從而建立正確的IT架構以高效適應各類變化因素。
安全性
最后但同樣的重要的是安全問題。我們需要利用團隊中每位成員的對應身份進行數據訪問管理,同時配合適當的數據加密機制,從而避免各類潛在風險。
大數據技術帶來的規模化趨勢同樣給科學、經濟以及政治等領域帶來深遠影響,甚至給人類的發展軌跡打上了深深的烙印。
大數據正挑戰我們的分析能力以及對世界的認知方式。因此在迎接變化及不斷成長的同時,我們亦應當堅守以人為本的原則,立足精益、與時俱進、秉持誠信并服務于整個世界。