大數據,是近幾年內最為熱門和重要的技術話題。8月31日,百度百家舉辦的第三期BIG,請來了可穿戴設備和大數據領域享有盛譽的世界級權威教授Alex Pentland,與百度百家共同探討大數據和可穿戴設備的未來。Alex Pentland直言他在生活中并不怎么使用可穿戴設備,因為現在技術和應有都不太成熟,這種判斷我也很認同,下文中我們將重點討論大數據話題的討論上。
大數據的價值是否被高估了?
現在單純地討論大數據是沒有現實意義的,它必須跟云計算相結合才能發揮出應有的作用。完整的大數據應用應該包括數據采集、存儲、分析、應用等環節。現在用瀏覽器訪問新浪網,首頁中間部門跳出的京東商城廣告,總是非常巧合地符合你的心意,這其實就是大數據的具體應用。通過采集用戶近期的購物習慣和搜索內容,給出非常有針對性的商品促銷廣告,這種針對性精準的廣告自然會帶來更強的購買轉化率。大數據的意義非凡,它將是未來商業非常重要的組成部分。
但有學者提出,大數據將是未來最重要的生產資料。也有廠商更是提出了“數據星球”的響亮口號,但就我的觀察來看,大數據具有非常明顯的兩面性,某些大數據是十分重要而且有價值的,但絕大部分離散的數據是無用的;挖掘大數據一方面可以產生高價值,但也可能給企業帶來沉重的成本負擔。我們通常看到的是大數據的正面意義,但用放大鏡看看它的反面會有不一樣的收獲。
人類歷史每一次生產力產生重大突破,針對核心生產資料的爭奪都會引發劇烈爭端甚至殘酷戰爭。至今,人類對石油資源的爭奪,還是引發局部戰爭的重要原因。但現在還沒有跡象表明,人類將為爭奪大數據的控制權而發生戰爭,所以在某種程度上來說,目前大數據還沒有達到最重要生產資料的戰略高度。
IT產業在技術發展的過程中,技術新概念是從未間斷的。大數據概念的提出,離不開互聯網深入滲透到各個行業的現實背景,數據量突增、數據種類繁雜、有用的數據甄別和挑選越來越難,這些問題都在困擾著用戶,所以也自然而然地誕生了巨大的商機,這便是IT廠商熱衷于大數據概念和業務的根本原因。
離散的靜態的數據本身并沒有太多價值,只有通過有效的手段提煉、分析,才能夠讓大數據點石成金,所以在大數據產業的生態鏈中,真正有價值的是數據提煉、挖掘和分析,而不是數據原型本身。
大數據是未來商業的核心?
我過去在微薄上看到了一個企業發布的應用案例,說一個鎮的銀行行長說“選址、選人都還是小事情,最大的問題就是IT系統的建設。”他們選擇了某企業的IT解決方案之后如何如何。我在這則微薄后的評論是:這是個失敗的宣傳案例,因為不真實,沒存款沒客戶才是小鎮銀行最要命的,IT建設很重要,但也別拔高到脫離現實的程度。
這是一種極普遍的現象,IT廠商在宣傳成功案例時往往將IT建設描述成仙藥,但其實IT系統的建設就是提升效率、規范業務流程的工具和幫手而已,商業客戶在生意中最為重要的資源優勢、商業模式等核心競爭力,其實都不是建一個IT系統能夠取代的。我買一雙運動鞋時最為看重的是舒不舒服,而選擇去哪吃午飯主要考慮的是哪家店味道好、干凈放心,雖然這些生意達成的背后,耐克或者KFC所建設的IT系統發揮了作用,甚至起到了線上直接導流客源的作用,但對于消費者來說,是否能成為回頭客再次光臨,那些IT系統并不是關鍵所在。
所以,大數據服務商應該對自己的有更清晰的定位,那就是盡職的業務流程服務商和助手,而并不能搶鏡去當人家業務流程中的主角。
大數據產業要想真正爆發,需要讓大多數企業嘗到大數據的甜頭,借助大數據技術幫助他們找到更多用戶、賺到更多錢,他們才愿意投入更多資金和資源,這才有可能形成良性互動。
但現在大數據的受益者主要來自于IT技術水準高超的互聯網企業或者IT企業,大多數行業還沒有在大數據浪潮中收獲真正的商業價值。
沙子并不重要,重要的是淘金術;數據本身并不能直接產生價值,挖掘、分析、應用環節,才是數據價值集中體現的環節。
大數據回避不了的成本問題
對于一個上馬了EPR系統的大中型企業,那么很可能每個月要面對數以TB級別甚至更大容量的業務數據增量,企業也要為此支付高額的大數據存儲、備份、安全防御的開支。
我們一方面要認識到,信息系統的上馬會大幅度地提升信息流的傳遞和分享,有助于業務流程的效率提升,但在另一方面也在加大了企業的成本開支。
有人做過一個形象的比喻,有價值數據就像沙子中的金粒,稀少而珍貴。很多企業的數據備份則像是為了留下這些金粒,而建設了足以裝下大沙堆的超大倉庫。我想將這個比喻引申一步,那就是做大數據解決方案的廠商因為幫你存下了沙子,從你手里拿走了金子;而你淘遍了整個倉庫沙堆得來的金子,很可能比你花出去買沙子的還多。如果你沒有很好的煉金術,請別花那么多錢建倉庫,也沒必要存那么多沙子。
在專業的大數據存儲和備份市場,去重率和壓縮比都是很重要的指標,但到了真正的項目實施中,因為有用數據夾在大量的無用信息之中,用戶往往在數據存儲的過程中花了大量的冤枉錢。針對數據的挖掘可以產生巨大的商業價值,但同時大量的無價值數據也會耗費大量的成本,所以我們應該對大數據有個投入產出的概念,而不能只關注大數據可能產生的效益,而忽視了大數據的成本問題。
大數據有時是易碎品和危險源
在IT企業大力宣傳云計算和大數據價值的時候,其實是沒有幾個廠家敢拍著胸脯說我能100%保證信息安全問題。
在今年春天舉辦的中國云計算產業論壇上,國內信息化專家曾經明確指出,政府等對信息安全敏感的客戶,絕不能使用公有云。所以對那些對安全性要求極高的客戶而言,大數據帶來的安全隱患也足以讓他們對大數據應用望而生畏。
用專業存儲備份和信息安全軟件,可以在很大程度上降低數據發生損壞和失竊的概率,但只是概率降低而已。我非常看好大數據市場,它未來會是IT產業中利潤最豐厚的一塊蛋糕。因為原始的大數據是脆弱而易于受到攻擊的,我們多數人和多數企業,都需要花更多的錢來保護它。
大數據是未來極為重要的技術手段,它有可能對現有的商業社會產生重大的影響。但我認為短時間內,大數據并不會成為現代商業社會的核心要素,也不會成為最重要的生產要素。就如同微薄上的雨夜求助信息,可以讓很多人知道你在三元橋需要車輛援助,但真正能把你送到家的是那些那些午夜冒中著巨大被淹風險的熱心市民和那輛涉水受損的車。
你可以觀察一下,現在大談大數據和云計算的主要是那些廠商,他們如此熱衷,是不是根本目的就是為了多賣幾臺高性能服務器或者網絡設備?
人,是現代生活的主角,而大數據只是人類活動的衍生物而已,雖然《黑客帝國》中對此有疑議,但起碼在我觀察到的世界和維度里是這樣的。