大數據無疑是未來影響各行各業發展的最受矚目的技術之一,不僅備受科技界推崇,也成了資本市場的寵兒,不少上市公司就因“沾”上大數據而股價飛漲。那么,大數據這個富礦要怎么挖才可以真正掘到真金白銀?在日前舉行的騰訊we大會上,ibm全球副總裁王陽指出,目前正處在數據大爆炸的前夜,計算變革開始進入第三階段,人們正在努力教會計算機如何通過數據實現它的自我學習,即傳統意義上的人工智能。
每年一次的we大會由騰訊公司舉辦,今年是第二屆,目的在于探索、分享互聯網和科技界的創新成果,打造連接中國與世界的跨界創新平臺。2014we大會重點關注太空旅行、腦機接口、人工智能、基因科技、智能交互等領域,這其中,王陽在大會上分享的大數據前景及人工智能計算機watson成為熱點話題。
ibm的一項研究顯示,過去兩年生成的信息占整個人類歷史信息總量的百分之九十。換言之,大數據的體量已經達到了傳統數據庫管理系統無法有效處理的程度。人們無論是使用手機,還是進行網絡購物,都會留下自己的數字足跡,每天產生的新數據接近250億億字節。其中約80%都是非結構化數據:這些是由原始文本、電子郵件、微博、討論帖和視頻等構成,這些數據來自自然語言,與數據庫所能理解的整齊的結構化數據大相徑庭。
有鑒于此,王陽指出,截至目前發生了三次計算變革,第一次是制表,把數字輸進去,把表格打出來,進行歸類。第二階段是編程,把人們對數字的理解,按照執行的方式方法,教給計算機,計算機不厭其煩地重復處理數據。現在,正處在第三階段的前期,背景是數據大爆炸,數據不光是結構、非結構的,它還是模糊的,存在不同的可能性,跟以往的計算方式不一樣。“這一階段對計算的要求是,能夠教會計算機我們是怎么理解世界的,人類是怎么進行學習、怎么感知和認知這個世界,一旦把這個事情教給計算機,所有數據的產生就讓計算機自己去學習。”
目前,一些前沿科技公司在大數據運用上已經取得了一些突破,最新投入運行的人工智能waston即是明證。和google、微軟的人工智能相比,waston從硬件芯片構架就開始模擬人類神經元,它可以理解人類的自然語言,還可以通過資料產生假設,并具備不斷自我學習的能力。王陽稱,watson已經可以通過開發者向智能終端用戶提供服務,開始為一些科學家服務,主要運用于醫藥領域。他說,伴隨著watson的改變是,把這個平臺開放出來,在云上面部署,任何對這些方面很好研究的人,都可以利用這個平臺進行加工,再重新進行反饋。
對于大數據來說,未來可能將不同的行業更加細分,針對不同的行業有著不同的分析技術。王陽認為,數據的多少并不意味著價值更高,但是更多的數據無疑更有助于一個行業的分析價值的發現,如醫療行業,如果每一個醫院對自己的數據進行分析,也能獲得相應的價值,但是如果想獲得更多更大的價值,則需要全國乃至全世界的醫療信息共享,這樣才能夠通過平臺分析獲取更大的價值。王陽表示,中國在未來將可能成為大數據最重要的市場,因為人口眾多且經濟發展迅猛,中國的數據產生量將是巨大的,這給中國大數據產業發展帶來機會。