澳洲昆士蘭大學教授周曉方
如何避免大數(shù)據(jù)系統(tǒng)只是一個酷炫的看板,澳洲昆士蘭大學教授周曉方表示:“首先要定位問題,企業(yè)需要解決什么問題,然后再去找數(shù)據(jù)幫我們去解決這個問題。其次,有了數(shù)據(jù)以后我們要解放思想,創(chuàng)造新的應用與價值。這個需要企業(yè)界和科研界合作解決這個問題。大數(shù)據(jù)是我們這個時代的特征,這個事情已經(jīng)在那,數(shù)據(jù)本身也在那里,數(shù)據(jù)應用的技術也在那里,要通過各種應用場景現(xiàn)才能真正落地。因此CIO們不能為了大數(shù)據(jù)而大數(shù)據(jù),而是要鎖定你要做的事情、你有數(shù)據(jù),還需要什么數(shù)據(jù),用這些數(shù)據(jù)把現(xiàn)有的工作做得更好,用這些數(shù)據(jù)推動新的應用。”
微軟亞洲研究院副院長、首席研究員劉鐵巖(左一);
華東師范大學數(shù)據(jù)科學與工程學院教授、博士生導師錢衛(wèi)寧(中);
滴滴出行高級副總裁章文嵩(右一);
滴滴出行高級副總裁章文嵩在運用大數(shù)據(jù)解決出行問題上深有體會:“首先要定位問題是什么,如何定義這些問題,把問題梳理清楚后基于這些問題看在數(shù)據(jù)上能不能得到一些啟示。滴滴是一個出行平臺,現(xiàn)在解決的問題是讓有需求的人迅速找到最近的車,因此每秒鐘這個車的位置數(shù)據(jù)都會記錄在我們的平臺上,這些連續(xù)的數(shù)據(jù)就是行車的軌跡,這個軌跡很好地呈現(xiàn)了在全國400多座城市的交通的狀況。我們發(fā)現(xiàn)這些數(shù)據(jù)在智慧交通的治理方面將是非常有價值的數(shù)據(jù),因此我們要擁有一些數(shù)據(jù)后才能發(fā)現(xiàn)數(shù)據(jù)的價值。”
“數(shù)據(jù)只是我們擁有的一部分,我們拿到的數(shù)據(jù)是一個基礎,一定要從過程中找到價值。過程是我們做機器學習的這個過程。”微軟亞洲研究院副院長、首席研究員劉鐵巖認為應該從人工智能這個維度運用好大數(shù)據(jù)。他表示,“大數(shù)據(jù)一定要把數(shù)據(jù)和智能結合起來,要有全盤的規(guī)劃。在這個角度來講。要什么數(shù)據(jù)是為了實現(xiàn)種業(yè)務目標找合適的數(shù)據(jù),而不是要拿到所有的數(shù)據(jù)留下來就好、數(shù)據(jù)大也有很多好的方面,很豐富,但也有壞的方面,有些是噪聲,有些可能是錯誤,如果沒有一個有效的方法把噪聲去除掉,把有價值的信息挖掘出來,最后也會把我們引導到一條錯誤的路上。”
對于數(shù)據(jù)質的量章文嵩非常重視:“數(shù)據(jù)質量非常關鍵,如果數(shù)據(jù)不準,得出的任何結論就會有問題,而解決的辦法涉及到數(shù)據(jù)的收集、生產(chǎn)、傳輸整個過程。我們對數(shù)據(jù)肯定是要層層校驗,哪些校驗有些環(huán)節(jié)數(shù)據(jù)不準了,或者有些環(huán)節(jié)數(shù)據(jù)丟了,就拿滴滴派單來說,用戶進來表達了他的目的地之后我們會有很多的動作,然后是我們平臺是否派單,派單在執(zhí)行中到完單最后到支付,這是個漏斗模型。其實層層環(huán)節(jié)都要校驗,發(fā)現(xiàn)哪些環(huán)節(jié)是網(wǎng)絡傳輸處理的BUG,哪些環(huán)節(jié)導致了數(shù)據(jù)丟失,層層校驗就跟財務做校驗一樣,每個環(huán)節(jié)都要校驗,確保數(shù)據(jù)準確性和軟件的正確性。
華東師范大學數(shù)據(jù)科學與工程學院教授、博士生導師錢衛(wèi)寧則認為:“數(shù)據(jù)已像我們的電一樣,人類文明在有電之前與有電之后很不一樣,如果有了電我還在用蒸汽機會覺得電沒有多大作用。現(xiàn)在有了數(shù)據(jù)之后,我們的業(yè)務模型或決策模型都是要變化,如果有了數(shù)據(jù)后還只是用作展示報表,這個還是傳統(tǒng)的思維模式。有了數(shù)據(jù)之后如何根據(jù)數(shù)據(jù)重構商業(yè)模式,去重新設計整個業(yè)務流程,才可以把數(shù)據(jù)用的更好。”