本文首發于微信公眾號:太和智庫。文章內容屬作者個人觀點,不代表和訊網立場。投資者據此操作,風險請自擔。
導語
大數據是指數據規模巨大、數據類型復雜的數據集,其本身蘊含著豐富的價值。盡管大數據已成為媒體和專家熱議的話題,但其有效利用程度仍然偏低。高德納(Gartner)咨詢公司副總裁兼著名分析師Debra Logan認為,95%-97%的組織和外部研究機構對大數據還只是處于探索階段,對于大數據的研究才剛剛起步。有鑒于此,太和智庫研究員近希撰文對目前大數據應用的場景和領域進行了簡要介紹,對未來中國大數據應用的趨勢作出了初步分析,并指出當前及今后一個時期大數據應用領域所面臨的挑戰。
一、從國內外案例看大數據應用
案例一:特朗普并非“黑天鵝”
不少人對特朗普當選大跌眼鏡,認為這是一次“黑天鵝”事件,然而通過分析2016年7月26日至11月7日美國大選期間的有關數據,我們不難發現特朗普的成功逆襲并非偶然。根據特朗普和希拉里在不同傳媒平臺上被熱議的內容,通過相關內容抽取所做的傾向性分析,人們得出了二人在選戰期間的輿論積極傾向變化圖(如圖1-1)。
圖1-1::輿論積極傾向變化圖
從圖表中可以看出,傾向于特朗普獲勝的比例較為穩定,而希拉里雖然曝光度頗高,但受“特朗普一半支持者都是無恥之徒”的言論、“郵件門”、邪教控國論、與警衛性丑聞等負面影響,希拉里已陷入信任危機,美國民眾對其好感驟降。因此不少美國民眾拋棄了在三次電視辯論中貌似取勝的希拉里,選擇了看起來“更為誠實”的特朗普。
案例二:高速公路擁堵趨勢預測
圖1-2:全國高速擁堵趨勢
圖1-3:春節期間易擁緩高速路段
2017年1月18日,新華網聯合高德地圖,根據往年車流量信息、高速擁堵信息等數據,運用大數據技術對2017年春節期間高速公路的車流擁堵情況做出預測,為人們選擇高速公路出行提供參考信息,從而在一定程度上緩解了高速公路的擁堵壓力。
案例三:電信大數據的多領域應用
國內電信運營商對于大數據的應用主要集中在基于位置的大數據分析服務、針對網絡廣告的潛在客戶挖掘服務、征信服務、行業精確營銷服務以及防詐騙等領域。以打擊電信詐騙為例,江蘇省公安廳副廳長程建東表示,自2016年8月使用線上惡意呼叫電信攔截平臺后,平均每天攔截詐騙電話2.1萬次,電信詐騙案因此同比往年下降84.6%。通過應用大數據技術,警方有效提升了打擊電信詐騙的能力。
案例四:電網運營智能管理
美國加州電網系統運營中心管理著加州超過80%的電力供應,每年向3500萬用戶輸送電力2.89億兆瓦,電力線長度超過4萬千米。該中心采用Space-Time Insight的軟件對電網運營進行智能管理,綜合分析來自氣象、傳感器、計量設備等各種數據源的海量數據,預測各地電力需求變化,同時進行智能調度,平衡全網電力供需,并對潛在危機做出快速響應。
案例五:心臟病致死幾率評估
美國麻省理工學院研究人員約翰·古塔格(John Guttag)和柯林·斯塔爾茲(Collin Stultz)創建了一個計算機模型,用以分析心臟病患者的心電圖數據。他們利用數據挖掘和“機器學習”技術篩選海量數據,發現心電圖中出現三類異常的人在一年內死于二次心臟病發作的機率比未出現者高1-2倍。相比傳統篩查方法,這種有大數據技術介入的新方法能夠識別出更多心臟病致死高危病人。
未來隨著大數據技術的不斷完善升級以及在醫學領域的廣泛應用,醫生將能通過對患者健康數據信息的深度挖掘讓診斷和治療更為精確。比如服藥,將不再遵循傳統的“成人每日三次,一次一片”的方法,而是通過檢測服藥者血液中藥劑是否已經代謝完畢自動提醒其再次服藥。
二、我國大數據應用的發展趨勢
據統計,2016年近 40%的中國公司正在實施和擴展大數據技術應用,另有30%的大中型公司計劃未來一年內采用大數據技術。隨著各種相關政策落地以及大數據應用領域的突破,預計中國大數據將在2017年迎來大發展。
(一)基于大數據技術的人工智能得到更加廣泛應用
2016年,無人駕駛汽車試駕成功,AlphaGo在圍棋對弈中勝出。隨著人工智能技術的日益成熟,未來公司企業將越來越多地運用甚至是依賴于人工智能技術。虛擬助手、智能機器人、智能顧問、自動駕駛汽車等多種技術都將得到更為廣泛的應用,而這一切都與大數據技術的發展與支撐密不可分。
(二)“機器學習”技術成為高科技投資重要領域
隨著大數據分析能力的提升,很多企業已開始進軍和投資“機器學習”技術領域。高德納咨詢公司稱,“機器學習”是2017年十大戰略技術之一。“機器學習”和人工智能系統正在超越基于規則的傳統算法,創建出越來越多能夠理解、學習、預測、適應甚至是自主操控的系統。
(三)智慧城市建設力度進一步加大
截至2016年6月,全國95%的副省級以上城市、超過76%的地級市,總計逾500座城市(占世界智慧城市創建總數一半以上)在政府年度工作報告中明確提出將要或正在建設智慧城市。中國已經成為世界創建智慧城市的主要試驗場,并引起美國、新加坡、歐盟和其他金磚國家的高度關注。此外,在可預見的將來,中國約70%的大數據需求將集中于政府應用和金融領域,而政府數據也將成為一項重要的國家資產。
(四)預測分析工具將倍受重視
根據2016年調查顯示,目前雖然僅有29%的公司使用預測分析技術,但預測分析工具在幫助企業把握商業先機、發掘潛在商業利益上所發揮的作用正在日益凸顯。未來隨著預測分析技術的日臻完善,企業將會越來越意識到運用預測分析工具的必要性和重要性,預測分析工具的使用數量也必將大幅增長。
(五)企業將普遍運用大數據技術強化網絡智能防護能力
許多企業已將大數據分析納入安全戰略范疇,特別是在網絡防護方面。網絡安全日志提供了以往發生的未遂網絡攻擊信息,利用這些數據,企業可以有效預測并防止未來可能發生的網絡攻擊。目前,一些公司正將其網絡安全信息和管理軟件與大數據平臺結合起來;一些公司則選擇向能夠提供大數據分析服務的公司求助,為其網絡安全防護提供幫助。
三、大數據應用技術領域面臨的挑戰
根據高德納咨詢公司 2016年7月的研究結果,大數據業務創新已成為“新常態”,但與此同時也有諸多技術領域亟待突破創新。
(一)智能數據挖掘(Smart Data Discovery)
在過去五年中,基于視覺的數據挖掘工具已經顛覆了傳統的商業智能(BI)和分析市場,其易于使用,并且能實現數據的快速組合,讓用戶在數據中找到新觀點,對未來的一些假設進行可視化探索。雖然智能數據挖掘在探索數據的方式上一直不斷變革,但許多與數據制備、海量復雜數據組合模式探索、見解分享相關的活動仍在很大程度上依賴人工完成。
(二)情感運算(Affective Computing)
情感運算技術能夠感知用戶情緒狀態 (通過傳感器、麥克風、攝像機或軟件邏輯),并通過執行預定指令做出回應反饋,比如與用戶之間的交互,或向用戶適時推薦符合其心情的視頻等。目前,與多個傳感器輸入相結合的情感運算技術仍停留在早期概念驗證階段,其難點主要在于尋找出擴展和增長記憶力的算法。
(三)自動駕駛(Autonomous Vehicles)
自動駕駛是指車輛不需要人類干預,借助各種車載技術和傳感器,如雷達、攝像頭以及控制系統、軟件、地圖數據、GPS和無線通信數據等,自行駛抵預定目的地。傳感器、定位、成像、引導、人工智能(AI)、映射和通訊技術的不斷進步,以及先進軟件和云計算的快速發展,已經讓自動駕駛成為現實。但由于自動駕駛技術本身的復雜性,加之研發成本居高不下,已嚴重影響了它的可靠性和可購性。2016年5月7日,美國佛羅里達州發生一起車禍,事故車輛型號是特斯拉Model S,車禍中死亡的車主當時使用的正是自動駕駛模式。
(四)自然語言問答(Natural-Language Question Answering)
目前,非對話式、以信息為中心的問答已經實現(例如谷歌Now和Siri),但根據用戶個人的對話、環境等完成一段簡短對話的技術還不是很成熟,仍面臨很多瓶頸問題,如:對有疑問的語句給出合理解釋,把未知范疇匹配到已有的知識庫中,從有限答案(甚至是一個答案)中做出選擇等。按照當前的關注度、發展速度以及技術能力,預計解決這些問題至少還需要5年時間。
結語
信息技術的飛速躍進已將人類拖入大數據時代,加快發展大數據技術是我們對這個時代必須作出的回應。未來,在數據與數據的碰撞、數據價值的深度開發、數據應用技術的落地等方面存在著巨大的想象空間,而大數據技術與各行業、產業的融合也必將產生強烈的化學反應,促使相關行業、產業發生顛覆性變革。與此同時,大數據領域也日漸成為強國競爭博弈的一個重要戰場。面對大數據時代的滾滾巨浪,崛起中的中國必須直面挑戰,把握機遇,在突破創新中,搶占先機,贏得主動。
文章來源:微信公眾號太和智庫