人工智能(AI),大數據(big data)和云計算(cloud computing)三大技術被認為是當今互聯網爭奪的關鍵點。而三大技術中中爭議最多的在于大數據技術,被夸大的效果和局限性的應用,很可能會讓大數據成為ABC三大技術中最先掉隊的一個。
ABC的格局
2010年,工業和信息化部與國家發改委聯合發布《關于做好云計算服務創新發展試點示范工作的通知》,云計算元年開啟。
2013年,阿里巴巴副總裁徐子沛提出該年當屬中國大數據元年,而這一觀點也得到了業界的普遍認同。
人工智能元年?沒有人知道什么時候會到來,但是總有一天會爆發。
云計算技術從一點孤星閃爍,到如今萬家燈火通明的局面。云計算產業的拉動已經造就了多個大型互聯網企業的再次爆發,強如軟件巨頭微軟也已經在近幾年全力轉型云計算并且大獲成功,Azure也讓這家稱霸互聯網超20年的巨頭綻放了第二春。而即便是沒有入局云計算的企業,也多為云計算技術的受益者。可以說云計算的力量在如今已經達到了鼎盛,而且未來依然有發展的空間。
發展人工智能幾乎成為互聯網行業的口號
人工智能技術一直被認為是離現實頗遠的一種,但是2016年,谷歌用一盤棋把世人驚醒,原來悄然發展的AI智慧程度已經達到了如此的境界。從監督學習到自主學習,人工智能的發展就像坐了火箭一樣不斷攀升,能夠涉足的領域也日益增多,而更可怕的還在于,人工智能現如今的狀態遠談不上成熟,未來第一大技術送給人工智能相信不會有太多人質疑。
相比之下,大數據就面臨了一個很尷尬的局面。起步雖說比云計算略遲,但好在發展夠迅猛,在去年大數據風頭正勁,阿里云方面提出2016年是萬億大數據產業元年,各類大數據處理平臺、處理技術紛紛呈現,大數據產業在各個行業應用,乍看之下并不存在任何問題。
但大數據的發展雖然足夠強悍,卻遠不能與AI和云計算相提并論。就像BAT三巨頭中,百度雖強,可與阿里騰訊畢竟不是同一等級的體量。
大數據的歡樂soon
大數據產業的爆發速度可謂極快。從2013年進入我國到現如今的萬億產業,這一技術用短短的幾年迅速搶占熱點并且發展成為全行業所關注的焦點,不可謂不成功。而大數據的成功有其必然性,也有時勢造英雄的運氣。
大數據:先有云算后有天
大數據的成功與云計算發展后計算力的提升有直接關系。大數據的第一特點就是大,大數據的大通常會被人誤解,于是小學生統計蘇軾詩詞短短幾十萬字都敢稱為“大數據”實在是貶低了這一技術。“大”的特點是要大到用常規手段無法統計的程度,而常規手段無法統計就需要借助云的力量,計算力的提升的大數據進行的基礎保障。
幫助數據變廢為寶。大數據直接解決的一個問題就是企業的廢棄數據問題。在大數據技術出現前,數據的重要性就已經引發了企業的重視,但問題在于,數據分揀和處理技術不足,企業空有數據卻不能轉化為生產力和收益點,而數據存儲成本又高,只能遺棄。大數據成果解決了這一點難題,幫助企業把自己原有的金子擦去灰塵,綻放光彩。
順風順水的大數據遇到了好時機
大數據遇到了開放的市場。這一點或許普通用戶很難意識到,但相比之下,中國的市場是全球最有活力的市場,也是最大度的市場。我國的市場復雜程度較高,因此往往能夠予以新生技術發展的土壤,大數據在我國的迅速開展也得到了政策和技術的多層面的保障。
政策支持提供通道,云計算幫助提供基礎,市場需求提供養料,大數據迅速發展達到巔峰。但是,這并不代表大數據的問題可以就此掩蓋,相反,越是不被注意,大數據的隱患就越根深蒂固。
君有疾,不治恐深
扁鵲見蔡桓公的時候,一在腠理,二在肌膚,三在腸胃,都有法可醫,但蔡桓公不聽,直到神仙難救,是有救而不自救。而大數據的問題顯然沒有那么深,但卻同屬于越拖越差的頑疾。
大數據的頑疾一:大數據價值被夸大,投入產出比遠不能讓人滿意。這一點頑疾是典型的人禍,換句話說就是有小部分的大數據企業正在敗壞大數據的行業形象。大數據的應用確實可以達到提升企業業務效率和決策效率的目標,但遠沒有部分企業所吹噓的那么神。
不僅搖不到錢,還得砸錢
大數據并不是搖錢樹,絕不能秒用變現。相反,大數據是一個變現較慢的技術,從大數據部署應用到影響決策,從決策部署實施到產生效果,整個流程周期很長而且變現效果未必就能盡如人意。高昂的投入,被吹的天花亂墜的預期,和平庸甚至讓人失望的結果,三者的夾擊下企業能對大數據還剩下多少好感呢?
大數據的頑疾二:對藥不對癥,低端難生存。大數據產業雖然現如今在進行全面化、全產業的推廣,但不可忽視的一點就是,大數據對低端產業并不友好。這一點并不難理解,低端產業數據量本身并不大,分析需求低,分析結果對企業的指導意義也小,因此需求度本就低。
有錢自己搞,沒錢我不要
而高端產業中,真正有需求的企業往往可以自成一脈。比如像阿里、騰訊此類巨頭企業,數據量過大,數據需求旺盛,因此不太可能選擇不同的大數據產品——一為數據安全,二為長期打算。所以,此類企業自己研發大數據技術或產品會更合適,而這種各自為戰的局面就可能造成大數據行業最不愿看到的情況,孤島化產生。
采據東籬下,悠然見難關
大數據的頑疾三:數據采集難度被低估。這種問題是來自兩個層次的,第一層面是技術提供方的低估,許多大數據產業的技術提供方都會側重于大數據的處理、管理和分析等流程,而在數據采集方面只是進行簡單的埋點等代碼方式解決。這種方法在互聯網行業可以一用,但在大數據推廣到其他行業之后就會受到嚴重的限制。
數據采集:要錢還是要全
在非互聯網行業數據采集時,企業往往會選擇易采集的數據,并非全面數據,這就是第二層問題,采集成本的限制。要收集多角度全面化的數據就需要增加采集投入,而不增加就會造成數據分析準確性降低,增加則可能讓效益成本比更低,兩難的境地讓大數據頗為尷尬。
大數據的頑疾四:隱私與安全成枷鎖。如果只是采集到數據就能一次性的使用,那么成本的投入也屬于可接受范圍。但問題在于,大數據的流動性較強,數據變化頻繁,普通的數據一般三個月就會面臨失效和滯后,而重新采集時則會面臨全新的局面。
盼我瘋魔,還盼我孑孓不獨活
同時,大數據在頻繁和多次采集時隱私問題就成為無法避免的一環。強如谷歌搜素采集用戶數據也需要用戶同意才能進行,但不同意的用戶怎么統計呢?這一大類用戶會不會成為導致“幸存者偏差”的一環呢?但如果強行獲取這部分用戶的數據,這些數據的所有權是誰的呢?
而且,一旦涉及用戶隱私直接相關的就是安全問題。企業采集到用戶的數據建立大數據庫,大數據庫價值斐然是黑客攻擊的焦點,而一旦數據失竊,到時候受傷最直接的卻并不是企業而是用戶,又有哪家企業能夠確保自家的數據庫絕對不會泄露數據呢?
大數據恐不再“大”
大數據的這些頑疾存在已經有一定的時間了,但真正付諸解決,獲得成效的頗為少見。隨著大數據在不同行業的深入開展,大數據的問題還會持續揭露,屆時是否能夠提供能解決問題的方案將有可能關乎大數據的未來發展。
DT時代數據依然為先,但可能不大了
在DT時代,數據量依然在爆炸呈指數型增長,每個用戶、每個企業都能產生大量的數據,而數據的處理手段也在不斷的“傻瓜”化,便捷化。每個人都能應用數據,都能處理數據,這一點相信一定會在技術的研發中實現,但問題在于,這些數據真的對每個人都有價值嗎?
一個企業可能花費數十萬把整個公司近十年的數據拿來分析一遍,然后交給決策者,決策者看后欣然決定:“沒錯,我們下一步要做人工智能!人工智能一定能賺錢!”但是,這些決策真的需要大數據來提供幫助嗎?即使這家企業確實做了人工智能,也實現了增長,那么功勞真的應該歸給大數據嗎?這家公司能稱之為數據驅動型增長企業嗎?
大數據目前面臨的就是一個這樣的問題,砸出去的是真金白銀,收回來的卻只是卻只是一群可能有用的信息。信息是無價的,觀點是無價的,但這個無價也可能真的就是一文不值。
大塊頭才要大數據
大數據在未來依然會強大,依然會是政府、公共事業、交通、航天等各種大型機構的必需品。可是對于普通企業以及普通員工來講,一張Excel表格也許就能解決問題,那么何必非要動用“核武”級別的大數據處理技術呢?在未來,數據依然重要無比,企業產生數據,分析數據,運用數據,可數據處理將會趨向常規化,而不會像大數據一樣轟轟烈烈。
未來,ABC之中的Big Data可能會卸下Big的頭冠,給Data讓位。數據才是大數據的核心,也是發展的核心,但這一切還需要考慮企業能否接受,和是否需要。