在巴西世界杯的一個月時間里,IBM中國研究院信息分析研究部研發總監蘇中熬了不少夜,但是他沒有看過一場比賽。有人發帖子說,“別人在看球,我們在看看球的人。”蘇中轉發了其中一條,評論說,“我在看那些看看球的人的人。”好像有點拗口,所謂看球的人,就是球迷;看看球的人的人,就是媒體的記者、編輯們,他們關注球迷的喜怒哀樂;蘇中看的則是媒體的記者、編輯們,幫他們更好地了解球迷的所思、所想,強化報道內容對受眾的粘性。
為了突破傳統的體育比賽報道模式,挖掘球迷的真實需求,創造獨特的報道視角,騰訊在本屆世界杯比賽報道中利用IBM的社交大數據分析和云計算技術針對社交網絡上球迷關于世界杯的廣泛評論、觀點、聲音進行實時分析,并獲得對球迷關注話題、球迷性格特點、球迷獨特觀點的實時掌握,從而讓球迷在騰訊網上享受到一場與眾不同的“足球報道盛宴”。蘇中在IBM中國研究院負責大數據分析。世界杯期間,蘇中和他的團隊與騰訊一起,抓取社交媒體中的海量數據,來支持騰訊對世界杯的報道。
IBM與騰訊帶來世界杯“新體驗”
社交網絡改變了世界杯的觀賽模式,對于網友和球迷來說,這屆世界杯堪稱一場“指尖上的世界杯”,微博、朋友圈等社交網絡成為球迷吐槽、評論和互動的陣地,產生了大量的數據:一場比賽獲得了1640萬次討論;15天時間累計達10億次轉發——海量的數據中蘊藏著大量有價值的信息和商機,也成為大數據技術的練兵場。
在世界杯開賽之前,IBM和騰訊“牽手”成為騰訊體育社交媒體數據分析合作伙伴。IBM根據網友和球迷在騰訊網絡媒體平臺及社交網絡上發布的海量公開信息和數據,通過大數據分析技術,獲得球迷話題、球迷類型、球迷個性分析等一系列洞察;同時還能根據這些信息得出網友心中真實的球隊支持率。而騰訊則通過這些分析得出的洞察來指導內容報道,細分受眾,制作球迷更加喜歡的內容。
1、實時獲取最真實的球迷對球隊的支持率
說起球迷支持率可謂是漫天飛舞,無論是不同媒體還是各類組織都在發起關于比賽的預測與投票,但這種帶有傾向性的調研是否真能體現球迷的心聲呢?
在傳統的賽事報道當中,支持率一般用投票來獲得,比如某一個網站推出阿根廷對陣德國,球迷支持哪個球隊,就可以投誰的票。這個投票數有時會達到10萬量級以上,貌似很客觀了。但其實,這樣得出的支持率數據是個主觀的數據,如果哪支球隊的球迷比較熱情的話,他們可能撲上去點,使勁投票,所以,得出的支持率也不一定是球迷內心真正的想法。
IBM則是在社交網絡上和微博上抓取球迷的聲音,通過自然語義分析,來獲得球迷內心最真實的想法。
很有意思的一個分析結果是,在7月7日,世界杯還未進入半決賽階段,IBM通過大數據分析得出的結論已經是這樣的:中國球迷對四強的支持率是——德國第一,阿根廷第二,荷蘭第三,巴西第四。這是根據6月15日到7月7日這段時間中國球迷對所有的球隊的支持數據累計分析出來的。雖然沒有投票,但每一個球迷的觀點都已經被聽到,都已經被展現,這才是中國球迷真正的聲音。
2、你的那個熬夜看球的朋友,他是怎樣的性格?
在世界杯觀賽期間,同為一個球隊、一名球星的粉絲,拉近了球迷與球迷的距離。就算你不是球迷,你從你熬夜看球的朋友鐘情于哪支球隊、哪個球星,也可以知道他(她)的性格。
IBM中國研究院信息分析研究部研發總監蘇中
蘇中介紹說:在大數據和球迷碰撞的過程當中,可以看到每一個球迷都有他自己背后的性格,而這背后的性格實際上是跟他喜歡的球員的性格非常相符,跟球員的表現也非常相符。我們知道,喜歡一個人、愛一個人不是無緣無故的,是什么樣的原因讓這個球員擁有了中國的球迷?有可能是技術、性格、人的魅力、英俊的外表……,IBM運用認知心理學的理論,通過大數據情感挖據的技術,分析、解讀了每一個球迷背后的特性。比如,梅西的球迷是低調、敏感、有條理性的,宅男宅女居多;C羅的球迷則不乏女王范、有氣場、愛熱鬧;咬人的蘇亞雷斯也有自己的粉絲,在社交媒體上在某個時間段內蘇亞雷斯占據了整壁江山。他的粉絲屬于低條例性,但是有想象力,敢于競爭,有自我。本屆世界杯踢進第一個烏龍球的巴西隊員馬賽洛,他也因為踢進烏龍球之后的天然呆萌的表情,引起了中國球迷的憐愛,大家不但不怪他,他的女粉絲所占的比例突然漲到了73.81%。
這些都是很有意思的事,騰訊將這些性格分析的結果融入賽事報道中,給了球迷們與眾不同的觀賽體驗。
3、熱詞挖掘幫媒體聚焦球迷真正感興趣的話題
感覺媒體的解讀缺乏深度?感覺專家的點評不靠譜?感覺已經吐槽無力?但在今年騰訊的世界杯報道中球迷們會發現不少意外的“驚喜”,驚喜于獨特的觀點,驚喜于與自己相同的視角。這些都是從哪里來的?這就是IBM社交大數據分析的能力,它通過對球迷關注熱詞、熱點話題、關聯話題的分析,可以讓編輯實時掌握球迷關注方向,并在報道的第一時間制作有針對性的內容,讓媒體報道在當前這個信息爆炸的新互聯網時代下重拾及時、深刻、獨特視角的特點,讓球迷不僅僅作為受眾,更被融入到話題創作過程中。
例如,在八分之一決賽的時候,IBM的社交數據抓到的一個最熱的詞——門神。有的球迷說,每場比賽不用看前90分鐘了,直接看最后的點球大戰就可以了。諾伊爾是門將兼后衛一肩挑,墨西哥、尼日利亞和阿爾及利亞的三位門神也特別震撼。IBM從數據中看到球迷對門將的關注度已經超過了前鋒,甚至超過了大牌球星,超過了球迷對他們本隊的關注度。甚至可以總結說:當今足壇的戰略走向已經從進攻型到防守型,誰能夠把門守得住,誰就能獲得最終勝利。尖刀已經不尖了,但是盾越來越厚。
還有,在西班牙出局之后,IBM通過社交數據抓取到了“皮箱登場”這個熱詞。因為上一屆的衛冕冠軍是要護送大力神杯一直到這一屆的比賽決賽的時候,送給這一屆的冠軍。雖然西班牙已經出局,但是他的隊長還要悲催地拎著裝有大力神杯的皮箱一直看著別的球隊在戰場上廝殺到最后,悲悲慘慘地交給現任的冠軍。
IBM對社交數據的挖掘,在騰訊的世界杯報道中發揮了錦上添花的作用。
為深度挖掘社交平臺上形式豐富的非結構化信息,提取有指導意義的洞察,IBM構建了IBM社交大數據分析解決方案系統,利用機器自學習方法和自然語言分析技術,傾聽網民“心聲”。
﹒命名實體識別:在處理非結構化數據時,不管球迷通過任何設備錄入信息,都有一些文字沒有標點符號,不同的短語在中文里有著不同的含義,需要IBM利用技術把人名、球隊名等識別出來,以便進一步的分析。
﹒話題檢測:該技術幫助識別網友討論的話題。
﹒語義情感分析:在理解球迷討論的話題后,利用該技術可以判斷球迷的立場是支持還是否定,從而獲得球迷情感上的傾向。
﹒網絡關系抽取:社交平臺上聚集了眾多球迷,討論各種類型的話題,利用網絡關系抽取技術,對出球迷集中討論的眾多話題進行綜合分析,IBM將話題間真正有價值、有分析意義的內容關聯出來。
在以上四大核心技術的基礎上,通過對社交數據進行分析,得出結論,騰訊在相關賽事的報道上通過風格和內容的調整,使報道更豐富,更加貼近讀者。
SoftLayer為大數據提供強大支持
在分析工作的背后,海量的數據是得出精準洞察的基礎。根據體育賽事特點,所有數據會以比賽時間為聚集點,爆炸性的涌現。這需要一個高度穩定,并極具擴展性的基礎架構平臺來支撐。這次,IBM將社交大數據分析平臺放到了剛剛開放開始提供給對外服務的IBM SoftLayer香港數據中心的公有云平臺上。IBM大中華區全球信息服務部云計算服務總經理余忠寧介紹說:數據量的不確定性對計算資源的彈性要求很高,能夠快速部署的云計算才能給予最好的支持。因此,大數據往往和云計算自然而然的連在一起。數據量激增時,SoftLayer云計算平臺快速部署服務器,調配更多的計算資源和存儲設備來支持系統正常運行。在數據量降低時,可以通過釋放計算資源,節約成本。
SoftLayer提供隨需應變的云基礎架構,其中包括物理裸機服務、虛擬服務器、存儲器以及網絡,它們都在一個平臺上,客戶完全可以進行訪問和控制。這些企業級組件能夠讓企業創建他們所需要的公有云、私有云或者混合云等基礎架構環境,用來支持企業最苛刻的應用和負載。實現這些獨特能力的關鍵途經之一是SoftLayer在世界各地以統一的、標準化的方式建立數據中心。每座數據中心都能夠提供相同的全自動化的服務組合,并擁有將所有數據中心連接到一起的專有、安全的網絡。
這次IBM把社交大數據分析平臺部署在SoftLayer這個云計算環境里頭,實時把分析結果推送到騰訊的世界杯網站上,幫騰訊的編輯人員實現實時的話題把控。
IBM大中華區全球信息服務部云計算服務總經理余忠寧
IBM大中華區全球咨詢服務部高級經理郭樹勇
IBM大數據分析技術與體育賽事的合作才剛剛開始,在其他行業,IBM很早就開始進行多方面的嘗試。IBM大中華區全球咨詢服務部高級經理郭樹勇介紹了IBM大數據分析技術在其他領域的應用。例如幫助快消企業快速了解市場對產品的反饋,通過快速評估為市場策略調整提供依據。和以往的市場調查相比,社交大數據分析反饋更快,更為靈活。目前,IBM已經幫助領先的快消企業傾聽社交媒體的聲音,獲得產品、服務、競爭對手和市場方面的反饋,更好的實現與消費者的互動,真正為產品生產、設計、包裝等各部門提供實際有效的建議。未來IBM社交大數據分析技術也將開發出更多針對行業領域的應用,幫助企業和行業更好的從大數據中獲取價值。
資料:
IBM與體育同行
對體育行業不懈支持,是IBM幾十年來一貫的做法。早在1960年,IBM就為美國斯闊谷冬奧會提供了第一臺電子數據處理系統。在之后的40年中,IBM一直是奧運會IT贊助商,為每一屆奧運會提供綜合信息服務。在1996年亞特蘭大奧運會和2000年悉尼奧運會,IBM還躋身TOP贊助商行列。在2000年悉尼奧運會上,IBM搭建了奧運資訊檢索系統、奧運競賽結果系統及奧運管理系統,幫助奧運參與人員及時、準確地獲取賽事信息,將成績即時分送給計分板以及全球的媒體并妥善地安排奧運參與人員。
在其他職業體育賽事中,IBM提供了豐富的結果和比賽管理系統,從而進一步拓展了在此領域的贊助和商業解決方案。1968年,IBM為美國網球公開賽提供了虛擬化技術,以提高系統利用率并降低能耗。之后,IBM幫助網球四大滿貫主辦方搭建官方網站并提供私有云服務,以承載上億次的點擊率并平穩運行,獨創的千里眼技術(Secondsight)、IBM SlamTracker、專門為網球賽事開發的3D體驗設計以及專屬智能手機應用開發極大地提升了觀眾體驗。在2013年的美國高爾夫大師賽上,IBM利用創新數字科技使球迷可以通過App、移動網站和手機等8種渠道觀看現場比賽視頻,實時獲知比分并收看精彩瞬間。
在剛剛結束的溫布爾登網球公開賽上,IBM的科技為公開賽的組織者、媒體和球迷提供了包括技術統計數字、比分和發球時速在內的各種有關信息,球迷還可以通過官方網站實時觀看從比賽現場傳送的每一場比賽,每一次得分的情況。
一直以來,IBM都在以先進的科技,助力各大體育賽事主辦方為球迷提供深入及時的觀賽體驗、用數據分析提供一流的戰略幫助運動員與教練提升技術水平,并推動整個體育行業的快速發展。不僅如此,以數據為代表的新科技也正在改變這個世界。無論從賽場到商場,還是從個人到社會,我們都可以感受到以數據為代表的科技之美。