大數據挑戰和機遇并存,大數據在未來幾年的發展將從前幾年的預期膨脹階段、炒作階段轉入理性發展階段、落地應用階段,大數據在未來幾年將逐漸步入理性發展期。未來的大數據發展
大數據發展的挑戰
目前大數據的發展依然存在諸多挑戰,包括七大方面的挑戰:業務部門沒有清晰的大數據需求導致數據資產逐漸流失;企業內部數據孤島嚴重,導致數據價值 不能充分挖掘;數據可用性低,數據質量差,導致數據無法利用;數據相關管理技術和架構落后,導致不具備大數據處理能力;數據安全能力和防范意識差,導致數 據泄露;大數據人才缺乏導致大數據工作難以開展;大數據越開放越有價值,但缺乏大數據相關的政策法規,導致數據開放和隱私之間難以平衡,也難以更好的開 放。
挑戰一:業務部門沒有清晰的大數據需求
很多企業業務部門不了解大數據,也不了解大數據的應用場景和價值,因此難以提出大數據的準確需求。由于業務部門需求不清晰,大數據部門又是非盈利部 門,企業決策層擔心投入比較多的成本,導致了很多企業在搭建大數據部門時猶豫不決,或者很多企業都處于觀望嘗試的態度,從根本上影響了企業在大數據方向的 發展,也阻礙了企業積累和挖掘自身的數據資產,甚至由于數據沒有應用場景,刪除很多有價值歷史數據,導致企業數據資產流失。因此,這方面需要大數據從業者 和專家一起,推動和分享大數據應用場景,讓更多的業務人員了解大數據的價值。
挑戰二:企業內部數據孤島嚴重
企業啟動大數據最重要的挑戰是數據的碎片化。在很多企業中尤其是大型的企業,數據常常散落在不同部門,而且這些數據存在不同的數據倉庫中,不同部門 的數據技術也有可能不一樣,這導致企業內部自己的數據都沒法打通。如果不打通這些數據,大數據的價值則非常難挖掘。大數據需要不同數據的關聯和整合才能更 好的發揮理解客戶和理解業務的優勢。如何將不同部門的數據打通,并且實現技術和工具共享,才能更好的發揮企業大數據的價值。
挑戰三:數據可用性低,數據質量差
很多中型以及大型企業,每時每刻也都在產生大量的數據,但很多企業在大數據的預處理階段很不重視,導致數據處理很不規范。大數據預處理階段需要抽取 數據把數據轉化為方便處理的數據類型,對數據進行清洗和去噪,以提取有效的數據等操作。甚至很多企業在數據的上報就出現很多不規范不合理的情況。以上種種 原因,導致企業的數據的可用性差,數據質量差,數據不準確。而大數據的意義不僅僅是要收集規模龐大的數據信息,還有對收集到的數據進行很好的預處理處理, 才有可能讓數據分析和數據挖掘人員從可用性高的大數據中提取有價值的信息。Sybase的數據表明,高質量的數據的數據應用可以顯著提升企業的商業表現, 數據可用性提高10%,企業的業績至少提升在10%以上。
挑戰四:數據相關管理技術和架構
技術架構的挑戰包含以下幾方面:
(1)傳統的數據庫部署不能處理TB級別的數據,快速增長的數據量超越了傳統數據庫的管理能力。如何構建分布式的數據倉庫,并可以方便擴展大量的服務器成為很多傳統企業的挑戰;
(2)很多企業采用傳統的數據庫技術,在設計的開始就沒有考慮數據類別的多樣性,尤其是對結構化數據、半結構化和非結構化數據的兼容;
(3)傳統企業的數據庫,對數據處理時間要求不高,這些數據的統計結果往往滯后一天或兩天才能統計出來。但大數據需要實時處理數據,進行分鐘級甚至是秒級計算。傳統的數據庫架構師缺乏實時數據處理的能力;
(4)海量的數據需要很好的網絡架構,需要強大的數據中心來支撐,數據中心的運維工作也將成為挑戰。如何在保證數據穩定、支持高并發的同時,減少服務器的低負載情況,成為海量數據中心運維的一個重點工作。
挑戰五:數據安全
網絡化生活使得犯罪分子更容易獲得關于人的信息,也有了更多不易被追蹤和防范的犯罪手段,可能會出現更高明的騙局。如何保證用戶的信息安全成為大數 據時代非常重要的課題。在線數據越來越多,黑客犯罪的動機比以往都來的強烈,一些知名網站密碼泄露、系統漏洞導致用戶資料被盜等個人敏感信息泄露事件已經 警醒我們,要加強大數據網絡安全的建設。另外,大數據的不斷增加,對數據存儲的物理安全性要求會越來越高,從而對數據的多副本與容災機制也提出更高的要 求。目前很多傳統企業的數據安全令人擔憂。
挑戰六:大數據人才缺乏
大數據建設的每個環節都需要依靠專業人員完成,因此,必須培養和造就一支掌握大數據技術、懂管理、有大數據應用經驗的大數據建設專業隊伍。目前大數 據相關人才的欠缺將阻礙大數據市場發展。據Gartner預測,到2015年,全球將新增440萬個與大數據相關的工作崗位,且會有25%的組織設立首席 數據官職位。大數據的相關職位需要的是復合型人才,能夠對數學、統計學、數據分析、機器學習和自然語言處理等多方面知識綜合掌控。未來,大數據將會出現約 100萬的人才缺口,在各個行業大數據中高端人才都會成為最炙手可熱的人才,涵蓋了大數據的數據開發工程師、大數據分析師、數據架構師、大數據后臺開發工 程師、算法工程師等多個方向。因此需要高校和企業共同努力去培養和挖掘。目前最大的問題是很多高校缺乏大數據,所以擁有大數據的企業應該與學校聯合培養人 才。
挑戰七:數據開放與隱私的權衡
在大數據應用日益重要的今天,數據資源的開放共享已經成為在數據大戰中保持優勢的關鍵。商業數據和個人數據的共享應用,不僅能促進相關產業的發展, 也能給我們的生活帶來巨大的便利。由于政府、企業和行業信息化系統建設往往缺少統一規劃,系統之間缺乏統一的標準,形成了眾多“信息孤島”,而且受行政壟 斷和商業利益所限,數據開放程度較低,這給數據利用造成極大障礙。另外一個制約我國數據資源開放和共享的一個重要因素是政策法規不完善,大數據挖掘缺乏相 應的立法。無法既保證共享又防止濫用。因此,建立一個良性發展的數據共享生態系統,是我國大數據發展需要邁過去的一道砍。同時,開放與隱私如何平衡,也是 大數據開放過程中面臨的最大難題。如何在推動數據全面開放、應用和共享的同時有效地保護公民、企業隱私,逐步加強隱私立法,將是大數據時代的一個重大挑 戰。
大數據發展趨勢
雖然大數據仍在起步階段,存在諸多挑戰,但未來的發展依然非常樂觀。大數據的發展呈現八大趨勢:數據資源化,將成為最有價值的資產;大數據在更多的 傳統行業的企業管理落地;大數據和傳統商業智能融合,行業定制化解決方案將涌現;數據將越來越開放,數據共享聯盟將出現;大數據安全越來越受重視,大數據 安全市場將愈發重要;大數據促進智慧城市發展,為智慧城市的引擎;大數據將催生一批新的工作崗位和相應的專業;大數據在多方位改善我們的生活。
趨勢一:數據資源化,將成為最有價值的資產
隨著大數據應用的發展,大數據價值得以充分的體現,大數據在企業和社會層面成為重要的戰略資源,數據成為新的戰略制高點,是大家搶奪的新焦點。《華 爾街日報》在一份題為《大數據,大影響》的報告宣傳,數據已經成為一種新的資產類別,就像貨幣或黃金一樣。Google、Facebook、亞馬遜、騰 訊、百度、阿里巴巴和360等企業正在運用大數據力量獲得商業上更大的成功,并且金融和電信企業也在運用大數據來提升自己的競爭力。我們有理由相信大數據 將不斷成為機構和企業的資產,成為提升機構和企業競爭力的有力武器。
趨勢二:大數據在更多的傳統行業的企業管理落地
一種新的技術往往在少數行業應用取得了好的效果,對其他行業就有強烈的示范效應。目前大數據在大型互聯網企業已經得到較好的應用,其他行業的大數據 尤其是電信和金融也逐漸在多種應用場景取得效果。因此,我們有理由相信,大數據作為一種從數據中創造新價值的工具,將會在許多行業的企業得到應用,帶來廣 泛的社會價值。大數據將在幫助企業更好的理解和滿足客戶需求和潛在需求,更好的應用在業務運營智能監控、精細化企業運營、客戶生命周期管理、精細化營銷、 經營分析和戰略分析等方面。企業管理既有藝術也有科學,相信大數據在科學管理企業方面有更顯著的促進,讓更多擁抱大數據的企業實現智慧企業管理。
趨勢三:大數據和傳統商業智能融合,行業定制化解決方案將涌現
來自傳統商業智能領域者將大數據當成一個新增的數據源,而大數據從業者則認為傳統商業智能只是其領域中處理少量數據時的一種方法。大數據用戶更希望 能獲得一種整體的解決方案,即不僅要能收集、處理和分析企業內部的業務數據,還希望能引入互聯網上的網絡瀏覽、微博、微信等非結構化數據。除此之外,還希 望能結合移動設備的位置信息,這樣企業就可以形成一個全面、完整的數據價值發展平臺。畢竟,無論是大數據還是商業智能,目的都是為分析服務的,數據全面整 合起來,更有利于發現新的商業機會,這就是大數據商業智能。同時,由于行業的差異性,很難研發出一套適用于各行業的大數據商業智能分析系統,因此,在一些 規模較大的行業市場,大數據服務提供商將會以更加定制化的商業智能解決方案提供大數據服務。我們相信更多的大數據商業智能定制化解決方案將在電信、金融、 零售等行業出現。
趨勢四:數據將越來越開放,數據共享聯盟將出現
大數據越關聯越有價值,越開放越有價值。尤其是公共事業和互聯網企業的數據開放數據將越來越多。我們看到,美國、英國、澳大利亞等國家的政府都在政 府和公共事業上的數據做出努力。而國內的一些城市和部門也在逐漸開展數據開放的工作。比如北京市在2012年就開始試運行政務數據資源網,在2013年年 底正式開放;上海在2012年啟動了政府數據資源開放試點工作,數據涉及地理位置、交通、經濟統計和資格資質等數據;2014年,貴州省也加入數據開放之 列,10月份云上貴州正式上線。對于不同的行業,數據越共享也是越有價值。如果每一個醫院想獲得更多病情特征庫以及藥效信息,那么就需要全國,甚至全世界 的醫療信息共享,從而可以通過平臺進行分析,獲取更大的價值。我們相信數據會呈現一種共享的趨勢,不同領域的數據聯盟將出現。
趨勢五:大數據安全越來越受重視,大數據安全市場將愈發重要
隨著數據的價值的越來越重要,大數據的安全穩定也將會逐漸被重視。網絡和數字化生活也使得犯罪的分子更容易獲取關于他人的信息,也有更多的騙術和犯 罪手段出現,所以,在大數據時代,無論對于數據本身的保護,還是對于由數據而演變的一些信息的安全,對大數據分析有較高要求的企業將至關重要。大數據安全 是跟大數據業務相對應的,與傳統安全相比,大數據安全的最大區別是安全廠商在思考安全問題的時候首先要進行業務分析,并且找出針對大數據的業務的威脅,然 后提出有針對性的解決方案。比如,對于數據存儲這個場景,目前很多企業采用開源軟件如Hadoop技術來解決大數據問題,由于其開源性,但是其安全問題也 是突出的。因此,市場需要更多專業的安全廠商針對不同的大數據安全問題來提供專業的服務。
趨勢六:大數據促進智慧城市發展,為智慧城市的引擎
隨著大數據的發展,大數據在智慧城市將發揮著越來越重要的作用。由于人口聚集給城市帶來了交通、醫療、建筑等各方面的壓力,需要城市能夠更合理地進 行資源布局和調配,而智慧城市正是城市治理轉型的最優解決方案。智慧城市是通過物與物、物與人、人與人的互聯互通能力、全面感知能力和信息利用能力,通過 物聯網、移動互聯網、云計算等新一代信息技術,實現城市高效的政府管理、便捷的民生服務、可持續的產業發展。智慧城市相對于之前數字城市概念,最大的區別 在于對感知層獲取的信息進行了智慧的處理。由城市數字化到城市智慧化,關鍵是要實現對數字信息的智慧處理,其核心是引入了大數據處理技術。大數據是智慧城 市的核心智慧引擎。智慧安防、智慧交通、智慧醫療、智慧城管等,都是以大數據為基礎的的智慧城市應用領域。
趨勢七:大數據將催生一批新的工作崗位和相應的專業
一個新行業的出現,必將在工作職位方面有新的需求,大數據的出現也將推出一批新的就業崗位,例如,大數據分析師、數據管理專家、大數據算法工程師、數據產品經理等等。具 有有豐富經驗的數據分析人才將成為稀缺的資源,數據驅動型工作將呈現爆炸式的增長。而由于有強烈的市場需求,高校也將逐步開設大數據相關的專業,以培養相 應的專業人才。企業也將和高校緊密合作,協助高校聯合培養大數據人才。如2014年,IBM 全面推進與高校在大數據領域的合作,引入強大的研發團隊和業務伙伴,推動“大數據平臺”和“大數據分析”的面向行業產學研創新合作以及系統化知識體系建設 和高價值人才培養,建設符合中國教學特色及人才需求的大數據相關學分課程,為未來建設特色專業方向做準備。
趨勢八:大數據在多方位改善我們的生活
大數據不僅用于企業和政府,也應用于我們的生活。在健康方面:我們可以利用智能手環監測,對我們的睡眠模式來進行追蹤,了解睡眠質量;我們可以利用 智能血壓計、智能心率儀遠程的監控身在異地的家里老人的健康情況,讓遠在他方的外出工作者更加放心;在出行方面:我們可以利用智能導航出行GPS數據了解 交通狀況,并根據擁堵情況進行路線實時調優。在居家生活方面:大數據將成為智能家居的核心,智能家電實現了擬人智能,產品通過傳感器和控制芯片來捕捉和處 理信息,可以根據住宅空間環境和用戶需求自動設置控制,甚至提出優化生活質量的建議,如我們的冰箱可能會在每天一大早建議我們當天的菜譜。
關于作者:傅志華先生曾為騰訊社交網絡事業群數據中心總監以及騰訊公司數據協會會長。在騰訊前,曾任DCCI互聯網數據中心副總裁。傅志華先生現就職于一家美國互聯網上市公司商業智能中心,同時任中國信息協會大數據分會理事、中國互聯網協會數據分析研究組專家、國際數字分析協會(DAA)專家,積極致力于推動大數據支撐企業運營和大數據經驗交流。