精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

百度大數(shù)據(jù)預測為何測不準

責任編輯:王李通

作者:李政葳

2015-04-11 08:50:59

摘自:光明日報

去年10月份電影《黃金時代》上映,大數(shù)據(jù)票房預測卻遭遇了“馬失前蹄”,這也讓不少人紛紛質疑大數(shù)據(jù)預測的準確度。沈陽還指出,在大數(shù)據(jù)預測過程中,各個行業(yè)中隨時都可能出現(xiàn)社會突發(fā)事件以及人們心理變化等不可控變量,這些因素也會大大影響大數(shù)據(jù)預測的精準度。

未來某一天,在你驅車前往公司的路上,導航系統(tǒng)通過預測交通流量,會自動幫你選擇一條最合適的交通路線;根據(jù)以往精準的歷史數(shù)據(jù)和參賽人員相關信息,互聯(lián)網(wǎng)公司就能提前預知如歐冠、NBA等體育賽事下一場哪方奪冠;可穿戴設備和智能健康設備幫助網(wǎng)絡收集人體健康數(shù)據(jù),或許將提醒你身體罹患某種慢性病的風險……

但是,大數(shù)據(jù)預測也會遭遇“測不準”的失敗。去年百度通過大數(shù)據(jù)預測電影《黃金時代》將熱映,結果恰恰相反。

大數(shù)據(jù)在改變哪些行業(yè)?

今年清明小長假期間,想知道全國哪些景區(qū)最火熱?各大5A景區(qū)舒適度如何?當游客在百度搜索“清明節(jié)旅游”等相關內容時,搜索結果頁右側則出現(xiàn)了全國景點擁擠度預測,在預測中,用紅、橙、黃、綠等色塊體現(xiàn)了不同景區(qū)的不同“熱度”。

大數(shù)據(jù)也被逐漸應用于新聞領域。去年1月,央視“晚間新聞”推出《“據(jù)”說春運》《“據(jù)”說春節(jié)》等大數(shù)據(jù)新聞報道,成為國內最早系統(tǒng)、持續(xù)地通過大數(shù)據(jù)技術改進電視新聞播出形態(tài)的欄目,并嘗試透過數(shù)據(jù)挖掘,講述春運背后的故事。

其實遠不只是這些行業(yè),大數(shù)據(jù)在股市、健康、電影、餐飲等各個行業(yè)領域已無處不在。“普遍滲透到各行各業(yè)的現(xiàn)象,是當前大數(shù)據(jù)發(fā)展的重要表現(xiàn),也是大數(shù)據(jù)從概念走向應用的明顯標志。”清華大學新聞與傳播學院教授沈陽表示。

央視綜合頻道新聞編輯部策劃組副組長、“據(jù)說”系列大數(shù)據(jù)報道項目負責人郭俊義認為:“隨著互聯(lián)網(wǎng)技術迅速發(fā)展,各個行業(yè)領域的大數(shù)據(jù)價值正被逐漸挖掘出來。大數(shù)據(jù)廣泛應用或許不一定給傳統(tǒng)行業(yè)帶來顛覆,但一定會帶來巨大變化。如果傳統(tǒng)行業(yè)不能適用‘互聯(lián)網(wǎng)+’下的大數(shù)據(jù)技術,那么可能在競爭浪潮中就處于下風。”

以大數(shù)據(jù)對傳媒領域的影響為例,郭俊義介紹,目前對電視節(jié)目的評價標準除收視率外,有些電視臺還將網(wǎng)絡影響力作為一個重要權重。因為電視節(jié)目在網(wǎng)絡媒體傳播、社交媒體評價等方面的效果反饋,很難通過人工方式收集,大多需要依靠大數(shù)據(jù)進行細致挖掘和分析。

此外,業(yè)界人士也指出,大數(shù)據(jù)已開辟了一個新聞報道的全新領域。“大數(shù)據(jù)讓新聞表達方式更加數(shù)據(jù)化,圖形、圖表等的運用讓新聞呈現(xiàn)形式更加可視化;同時新聞生產(chǎn)也更加實時化,依靠大數(shù)據(jù)挖掘手段,媒體從業(yè)人員能迅速準確地找到熱門選題;此外,大數(shù)據(jù)還能幫助新聞產(chǎn)品完成在傳播過程中的評估以及傳播效果的反饋。”沈陽說。

客觀看待大數(shù)據(jù)預測失準

有人說,就電影行業(yè)而言,大數(shù)據(jù)是市場拓展與經(jīng)營的救命丹藥——因為在對以往數(shù)據(jù)把握的基礎上,大數(shù)據(jù)對電影票房的預測曾被業(yè)界認為“可圈可點”。不過,去年10月份電影《黃金時代》上映,大數(shù)據(jù)票房預測卻遭遇了“馬失前蹄”,這也讓不少人紛紛質疑大數(shù)據(jù)預測的準確度。

大數(shù)據(jù)預測究竟靠不靠譜?重慶大學新聞學院院長董天策認為,大數(shù)據(jù)預測在不同領域的成熟程度不同,相比氣象、經(jīng)濟、機器制造等領域,電影領域涉及的變量頗為復雜,預測過程中也帶有較強的偶然性,出現(xiàn)預測偏差情況也屬正常。

董天策進一步分析說,網(wǎng)絡輿情很多時候和該領域的用戶結構有莫大關聯(lián),因此,大數(shù)據(jù)網(wǎng)絡用戶結構和社會整體結構存在偏差,導致了現(xiàn)有數(shù)據(jù)積累不能代表整體社會心態(tài)。“和傳統(tǒng)抽樣調查相比,雖然大數(shù)據(jù)的數(shù)據(jù)量大、運作速度快,但很多時候存在‘變量遺漏’和‘樣本偏差’等狀況。即使將所有數(shù)據(jù)提取出來預測分析,其預測結果也不夠準確。這個問題在各個領域都或多或少存在。”

除當前大數(shù)據(jù)總量普遍存在積累不足、數(shù)據(jù)收集不完整外,沈陽認為,現(xiàn)有數(shù)據(jù)中還存在很多“垃圾數(shù)據(jù)”“臟數(shù)據(jù)”等干擾信息,由于預測手段的局限,這些因素對預測結果造成了負面影響。

此外,沈陽還指出,在大數(shù)據(jù)預測過程中,各個行業(yè)中隨時都可能出現(xiàn)社會突發(fā)事件以及人們心理變化等不可控變量,這些因素也會大大影響大數(shù)據(jù)預測的精準度。

大數(shù)據(jù)價值有待充分挖掘

作為“互聯(lián)網(wǎng)+”的重要范疇,業(yè)界人士大多認同,大數(shù)據(jù)預測將是未來各行各業(yè)的重要趨勢。不過,大數(shù)據(jù)預測在很多方面還有待進一步完善,大數(shù)據(jù)的潛在價值也有待進一步挖掘。因此,如何讓大數(shù)據(jù)預測更加精準,更充分地服務社會生活,一直是業(yè)界思考的問題。

專家指出,各行業(yè)領域加強本身大數(shù)據(jù)積累的同時,還應該促進信息的開放和互聯(lián)互通。“當前很多數(shù)據(jù)都是孤立存在,因為很多互聯(lián)網(wǎng)公司的大數(shù)據(jù)都是其核心價值,由于涉及商業(yè)價值和商業(yè)秘密,要做到彼此間共享還有一定局限。”郭俊義說,“政府部門也應該加強交通、人口、經(jīng)濟等領域內的大數(shù)據(jù)公開,這樣大數(shù)據(jù)積累才會越來越多。”

要加強互聯(lián)網(wǎng)公司、各機構間的連接,打破“信息孤島”狀況。沈陽認為,應建立相關社會協(xié)調機構,設立比較好的數(shù)據(jù)連接標準,形成相關產(chǎn)業(yè)規(guī)范,不斷鼓勵數(shù)據(jù)研發(fā)創(chuàng)新;同時,逐漸形成科學的數(shù)據(jù)“清洗”方式,建立一套“垃圾數(shù)據(jù)”評估機制,確保每一部分數(shù)據(jù)來源的有效性。

如何減少數(shù)據(jù)預測過程中突發(fā)的變量干擾?“針對同一對象的預測,可通過不同來源的大數(shù)據(jù)預測結果交叉印證。”郭俊義表示,以對景區(qū)某一時間段人流量的測算為例,可通過游客WiFi熱點、LBS手機定位、手機信號等多種方式進行數(shù)據(jù)收集分析,再將得到的多個預測結果相互印證,其準確度和可信度都會大幅提升。

而隨著大數(shù)據(jù)積累以及測算手段的不斷進步,對于如何在大數(shù)據(jù)安全和個人隱私保護方面持續(xù)跟進,郭俊義認為,“大數(shù)據(jù)安全和網(wǎng)絡信息安全一脈相承,不僅需要健全法律規(guī)范,而且也需要相關行業(yè)的自律”。

鏈接已復制,快去分享吧

企業(yè)網(wǎng)版權所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號

  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 晋宁县| 汉寿县| 鹤壁市| 连山| 石屏县| 崇义县| 宁陕县| 永清县| 濮阳市| 浪卡子县| 武川县| 政和县| 梅州市| 射洪县| 平乐县| 阳春市| 禹城市| 安仁县| 唐河县| 如东县| 房产| 清涧县| 确山县| 顺平县| 浦北县| 塔河县| 大方县| 法库县| 神农架林区| 蒲江县| 界首市| 尉氏县| 班戈县| 镇宁| 壶关县| 巍山| 凤庆县| 巨鹿县| 荔波县| 达孜县| 莱芜市|