精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

當前位置:大數據業界動態 → 正文

四家公司用"大數據"預測世界杯 你也可以變成"預言帝"

責任編輯:editor004 |來源:企業網D1Net  2014-07-16 14:36:57 本文摘自:青年時報

上一屆世界杯,章魚保羅風頭大出,8猜8中的準確率,讓人驚呼此乃“預言帝”。今年打得火熱的世界杯,同樣有看頭,不過,這次看的不是動物,而是大數據。數家技術公司賽前就推斷出各場比賽的輸贏,堪稱賽場外的另一場“世界杯”。

大數據,這三個字近幾年來越來越火,聽著也很高大上(高端大氣上檔次的縮寫)。到底大數據是什么?它是怎么來預測賽事的輸贏的?大數據還能用來干什么?記者連線浙大計算機科學與技術學院人工智能研究所吳飛教授,和大家一探究竟。

四家公司的預測PK賽

在世界杯期間,幾家科技公司參與預測“世界杯”賽況。

微軟、百度以及高盛參與了小組賽階段48場比賽的預測。結果,準確率達58.33%的百度排在第一,緊隨其后的是準確率為56.25%的微軟,然后是37.5%的高盛。

在淘汰賽階段,谷歌參與了進來,高盛則沒有繼續進行預測的PK賽。不過,谷歌僅預測了16進8和8進4的兩輪比賽,微軟和百度則進行了全程預測。最終,谷歌預測的12場比賽中,正確了11場,準確率達到了91.67%;而微軟和百度則是除了季軍隊伍的預測出現偏差之外,其余的場次預測都是正確的。

這幾家技術公司所采用的方法,全是有理有據,并非“天機不可泄露”。從各家公布的資料來看,他們建立預測模型的數據來源各有千秋。

微軟的預測技術是基于對世界杯各支球隊的過往比賽結果、比賽時間、天氣情況、主場優勢以及其他因素進行綜合評估后作出的判斷,相對而言,微軟依賴于競彩指數。

谷歌云計算平臺,則是根據全球每個職業足球聯盟的歷史數據,以及巴西世界杯小組賽期間的統計數據,加上對世界杯參賽球員此前比賽中的表現進行分析,總的來說,谷歌對各國球隊過去的球賽數據的分析借鑒得比較多。

百度則搜索了過去5年內全世界987支球隊的3.7萬場比賽數據,并將博彩市場數據融入到預測模型中,構建了本次預測模型。該模型共涉及到19972名球員和1.12億條相關數據,所分析的球隊不僅包括207支國家隊,還囊括了歐洲、南美、亞洲等聯賽俱樂部及低級別球隊信息。

擅長投資分析的高盛,通過對自1960年以來的正式國際足球比賽數據的回歸分析,來構建預測模型,還通過泊松模型分析了每場小組賽的比分情況。

數據之間的聯動性很強

根據百度百科的解釋,大數據,又叫巨量資料,指的是所涉及的資料量規模巨大到無法通過目前主流軟件工具,在合理時間內達到擷取、管理、處理并整理成為幫助企業經營決策更積極目的的資訊。大數據有“4V”特點:大量、高速、多樣,以及價值。

“從字面上來理解,大數據是指獲取數據的數量,利用傳統方法或者說現有的計算方法已經無法處理。”吳飛解釋說,我們也可以進一步進行理解,就是從大量的數據中,獲取有用的信息或知識,用來指導我們的生活、生產或學習,“我認為這也是大數據的最終目的。”

那我們要如何拿數據去預測呢?吳飛教授說,大家也可以通過大數據分析,去預測明天會不會下雨,“如說下雨是和云層有關的,假設有研究表明當云層厚度達到10米的時候,就會下雨;再通過搜集杭城兩年來的溫度、風向等數據,建立一個函數,我們就可以根據這個結論,進行預測。”

當然,這個例子是比較簡單的,但現實生活中的現象通常都很復雜,數據之間的關聯性也不斷增強,吳飛教授表示,堵車,這件事的判斷因素不僅僅是說地面車流的情況,杭州的交通能不能承載這么大的流量,它還可能和上下班的時間、是否有商場打折、附近是否有學校放學等一系列的因素有關,這時候,就無法像下雨那樣,用一個小數據進行判斷。

回到世界杯,足球比賽的預測同樣是一件非常復雜的事情,不僅跟隊員個人能力、家庭情況、隊員之間的配合程度有關,教練的能力、國家的情況以及對手的相關情況,都會影響比賽的結果。“據我所知,德國就利用一套數據分析系統,可以導出每個球員的數據,從而來對隊員進行針對性的訓練,讓他們能踢好比賽。”吳飛教授表示。

大數據還能測流感趨勢

隨著技術都在不斷發展,大家收集數據的能力和手段也在不斷增強,我們可以獲得更多的看似無關卻很有用的數據。“現在獲取數據并不是一件困難的事情,對數據的處理能力、建立一個合理的模型是利用大數據進行預測的重要工作。”吳飛教授表示,如何從大量的數據中提取出有用的信息或知識,再轉化成有關的計算機語言,輸入到模型中讓這個模型變得有效,這一系列步驟看著各自為政,其實環環相扣,缺一不可。

據了解,除了足球領域,微軟的預測技術此前還成功預測過《美國之聲》等選秀節目的晉級情況。這讓人不禁疑惑,除了比賽結果,大數據還能用來干什么呢?

百度此前就利用它的APP,獲取用戶的地理位置,勾勒出全國人民春節遷徙圖,“若是能進一步開發,獲知哪些人是因為哪些事而遷徙的,這就能讓我們更合理地分配社會資源。”吳飛教授補充說。

而谷歌在2009年的時候,也作了一項預測——流感。就拿我國來說,流感的發展趨勢,通常是通過醫院上報的數據,比如人數突然激增等來進行預警,而谷歌則不是,它利用以前的數據,還有該地區在該時間段進行關鍵詞搜索的數量,來進行一個判斷,預測流感是否會暴發。吳飛教授表示:“就以手足口病為例,如果周圍有孩子生了這個病,家長就可能會開始搜索,這種病是什么、會怎么樣、要怎么治療等等,搜索量會顯著增加。”

關鍵字:谷歌PK賽巴西世界杯預測模型

本文摘自:青年時報

x 四家公司用"大數據"預測世界杯 你也可以變成"預言帝" 掃一掃
分享本文到朋友圈
當前位置:大數據業界動態 → 正文

四家公司用"大數據"預測世界杯 你也可以變成"預言帝"

責任編輯:editor004 |來源:企業網D1Net  2014-07-16 14:36:57 本文摘自:青年時報

上一屆世界杯,章魚保羅風頭大出,8猜8中的準確率,讓人驚呼此乃“預言帝”。今年打得火熱的世界杯,同樣有看頭,不過,這次看的不是動物,而是大數據。數家技術公司賽前就推斷出各場比賽的輸贏,堪稱賽場外的另一場“世界杯”。

大數據,這三個字近幾年來越來越火,聽著也很高大上(高端大氣上檔次的縮寫)。到底大數據是什么?它是怎么來預測賽事的輸贏的?大數據還能用來干什么?記者連線浙大計算機科學與技術學院人工智能研究所吳飛教授,和大家一探究竟。

四家公司的預測PK賽

在世界杯期間,幾家科技公司參與預測“世界杯”賽況。

微軟、百度以及高盛參與了小組賽階段48場比賽的預測。結果,準確率達58.33%的百度排在第一,緊隨其后的是準確率為56.25%的微軟,然后是37.5%的高盛。

在淘汰賽階段,谷歌參與了進來,高盛則沒有繼續進行預測的PK賽。不過,谷歌僅預測了16進8和8進4的兩輪比賽,微軟和百度則進行了全程預測。最終,谷歌預測的12場比賽中,正確了11場,準確率達到了91.67%;而微軟和百度則是除了季軍隊伍的預測出現偏差之外,其余的場次預測都是正確的。

這幾家技術公司所采用的方法,全是有理有據,并非“天機不可泄露”。從各家公布的資料來看,他們建立預測模型的數據來源各有千秋。

微軟的預測技術是基于對世界杯各支球隊的過往比賽結果、比賽時間、天氣情況、主場優勢以及其他因素進行綜合評估后作出的判斷,相對而言,微軟依賴于競彩指數。

谷歌云計算平臺,則是根據全球每個職業足球聯盟的歷史數據,以及巴西世界杯小組賽期間的統計數據,加上對世界杯參賽球員此前比賽中的表現進行分析,總的來說,谷歌對各國球隊過去的球賽數據的分析借鑒得比較多。

百度則搜索了過去5年內全世界987支球隊的3.7萬場比賽數據,并將博彩市場數據融入到預測模型中,構建了本次預測模型。該模型共涉及到19972名球員和1.12億條相關數據,所分析的球隊不僅包括207支國家隊,還囊括了歐洲、南美、亞洲等聯賽俱樂部及低級別球隊信息。

擅長投資分析的高盛,通過對自1960年以來的正式國際足球比賽數據的回歸分析,來構建預測模型,還通過泊松模型分析了每場小組賽的比分情況。

數據之間的聯動性很強

根據百度百科的解釋,大數據,又叫巨量資料,指的是所涉及的資料量規模巨大到無法通過目前主流軟件工具,在合理時間內達到擷取、管理、處理并整理成為幫助企業經營決策更積極目的的資訊。大數據有“4V”特點:大量、高速、多樣,以及價值。

“從字面上來理解,大數據是指獲取數據的數量,利用傳統方法或者說現有的計算方法已經無法處理。”吳飛解釋說,我們也可以進一步進行理解,就是從大量的數據中,獲取有用的信息或知識,用來指導我們的生活、生產或學習,“我認為這也是大數據的最終目的。”

那我們要如何拿數據去預測呢?吳飛教授說,大家也可以通過大數據分析,去預測明天會不會下雨,“如說下雨是和云層有關的,假設有研究表明當云層厚度達到10米的時候,就會下雨;再通過搜集杭城兩年來的溫度、風向等數據,建立一個函數,我們就可以根據這個結論,進行預測。”

當然,這個例子是比較簡單的,但現實生活中的現象通常都很復雜,數據之間的關聯性也不斷增強,吳飛教授表示,堵車,這件事的判斷因素不僅僅是說地面車流的情況,杭州的交通能不能承載這么大的流量,它還可能和上下班的時間、是否有商場打折、附近是否有學校放學等一系列的因素有關,這時候,就無法像下雨那樣,用一個小數據進行判斷。

回到世界杯,足球比賽的預測同樣是一件非常復雜的事情,不僅跟隊員個人能力、家庭情況、隊員之間的配合程度有關,教練的能力、國家的情況以及對手的相關情況,都會影響比賽的結果。“據我所知,德國就利用一套數據分析系統,可以導出每個球員的數據,從而來對隊員進行針對性的訓練,讓他們能踢好比賽。”吳飛教授表示。

大數據還能測流感趨勢

隨著技術都在不斷發展,大家收集數據的能力和手段也在不斷增強,我們可以獲得更多的看似無關卻很有用的數據。“現在獲取數據并不是一件困難的事情,對數據的處理能力、建立一個合理的模型是利用大數據進行預測的重要工作。”吳飛教授表示,如何從大量的數據中提取出有用的信息或知識,再轉化成有關的計算機語言,輸入到模型中讓這個模型變得有效,這一系列步驟看著各自為政,其實環環相扣,缺一不可。

據了解,除了足球領域,微軟的預測技術此前還成功預測過《美國之聲》等選秀節目的晉級情況。這讓人不禁疑惑,除了比賽結果,大數據還能用來干什么呢?

百度此前就利用它的APP,獲取用戶的地理位置,勾勒出全國人民春節遷徙圖,“若是能進一步開發,獲知哪些人是因為哪些事而遷徙的,這就能讓我們更合理地分配社會資源。”吳飛教授補充說。

而谷歌在2009年的時候,也作了一項預測——流感。就拿我國來說,流感的發展趨勢,通常是通過醫院上報的數據,比如人數突然激增等來進行預警,而谷歌則不是,它利用以前的數據,還有該地區在該時間段進行關鍵詞搜索的數量,來進行一個判斷,預測流感是否會暴發。吳飛教授表示:“就以手足口病為例,如果周圍有孩子生了這個病,家長就可能會開始搜索,這種病是什么、會怎么樣、要怎么治療等等,搜索量會顯著增加。”

關鍵字:谷歌PK賽巴西世界杯預測模型

本文摘自:青年時報

電子周刊
回到頂部

關于我們聯系我們版權聲明隱私條款廣告服務友情鏈接投稿中心招賢納士

企業網版權所有 ©2010-2024 京ICP備09108050號-6 京公網安備 11010502049343號

^
  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 潮州市| 岫岩| 元朗区| 雷山县| 昔阳县| 会昌县| 醴陵市| 北碚区| 新营市| 涪陵区| 北票市| 阿荣旗| 赫章县| 绥中县| 垫江县| 来安县| 湛江市| 喀什市| 敖汉旗| 怀远县| 若尔盖县| 柏乡县| 海门市| 南安市| 十堰市| 成武县| 吉林省| 柯坪县| 大渡口区| 彭泽县| 时尚| 通城县| 奉化市| 山阳县| 茌平县| 云南省| 乌兰县| 达尔| 阿瓦提县| 塘沽区| 临洮县|