精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

科學家用大數據探究行為背后的機理和因果關聯

責任編輯:editor007

作者:貢曉麗

2017-07-22 18:39:56

摘自:科學網

“我們發現,大多數用戶在使用同一款手機壁紙軟件時,一般瀏覽到第七頁就會退出,這是通過大量的用戶瀏覽時長

“我們發現,大多數用戶在使用同一款手機壁紙軟件時,一般瀏覽到第七頁就會退出,這是通過大量的用戶瀏覽時長、翻頁數據分析得出的‘七頁法則’。因此,如何使用戶度過‘審美疲勞’的第七頁,繼續留在軟件中?就是軟件開發者需要琢磨的事情了。”近日,在中國計算機學會青年計算機科技論壇舉辦的社交網絡與大數據前沿學術報告會上,中科院計算所副研究員羅平表示。

隨著微信、微博、Facebook、Twitter等線上社交平臺的普及與廣泛應用,用戶可以隨時隨地的在網絡上分享內容,進行互動,由此產生了海量的用戶數據。用戶在社交平臺上的行為數據某種程度上構成了真實世界的投影,因此針對社交網絡的研究與大數據挖掘擁有廣泛的應用場景與深遠的現實意義。

目前針對社交網絡的研究與數據挖掘還處于相對初級的階段,很多基礎性的問題有待探索,有效的工程方法有待解決,羅平帶來的《大數據背景下的行為機理和可解釋性挖掘》報告就是對這項工作的嘗試。

探究行為背后的機理和因果關聯

社交網絡分析和研究的范圍非常廣泛,包含了針對社交網絡自身演化規律的研究;針對社交網絡結構的分析,關系鏈挖掘,群組發現等;通過用戶數據挖掘形成多維度立體的用戶畫像;以及與社會學、傳播學、行為學、心理學等學科交叉研究分析社會的運行規律等。

社交網絡研究擁有非常廣泛的應用場景,羅平所從事的就是針對個體用戶的精準營銷、個性化推薦以及方興未艾的社交AI(人工智能)研究。

“由于完整的用戶行為數據往往被分散式擁有,可供分析的用戶行為只能反映某些零散的片段。因此,鑒于行為數據的不確定性和不完備性,我們更有必要探究行為背后的深層機理,并挖掘可解釋的行為因果關聯。”羅平解釋自己的研究領域時說。

“什么是深度學習?就是通過將從輸入到輸出的復雜映射轉化為大規模的非線性實數運算。”羅平介紹說。當前的深度學習方法已成功應用于自然語言建模的多個場景,如機器翻譯、智能對話、關系抽取等。

然而,同樣是離散型隨機變量的序列數據,人類行為受社會、心理、傳播等復雜因素的影響,也呈現出更大程度的不確定性。因此,羅平采用了不同于深度學習的分析方法來研究社交網絡。

“深度學習并不是適用于所有的場景,在某些分析角度就不具有功效,尤其在語言和行為分析方面,深度學習仍有欠缺。”羅平說。

“語言和行為都屬于離散型隨機變量的序列數據,但又有本質區別。”羅平介紹說,例如,“你吃午飯了嗎”一句話中,即使缺少詞語,機器也可以分辨詞組意義,而且準確性很高。但是行為的不確定性就非常高,比如購買行為,就很難從用戶本次購買物品中推斷下次購買需求。

“消費行為是由很多復雜因素決定的,包括心理學、傳播學、社會學等各種因素,而且很多消費行為是沖動消費,與之前的行為沒有邏輯關聯,這就是行為的第一個特點——非常高的不確定性。”羅平說。

與此同時,行為數據還有另一個特點——不完備性。“消費者使用的購物軟件可能有很多,當我們在分析行為數據的時候,可能只能獲得某一個網站提供的數據,而無法從上帝視角獲知全部行為。”羅平說。

他表示,“數據分散在網絡的各個角落,我們獲知的只是所有數據的一個片段,這給預測行為增加了難度,我們只能在不確定性和不完備的數據上做這些分析,一方面挖掘行為背后的深層機理;另一方面,對線上和線下行為進行聯合建模,在概率圖模型的框架下挖掘可解釋的行為之間的因果關聯”。

“七頁法則”

通過用戶對一款手機壁紙軟件的瀏覽頁數和時長、點擊次數、收藏張數等數據序列分析,羅平發現,用戶瀏覽到第七頁的時候,離開的可能性最大。

是什么決定了用戶離開?羅平解釋,整個使用過程就是信息累積的過程,當信息累積到某個閾值,用戶的信息胃口得到滿足,大腦發出終止瀏覽的指令。羅平要做的,就是用數學的方式刻畫出這種看似主觀的行為理解。

“用戶在互聯網上的瀏覽長度服從逆高斯分布,并通過心理學中的‘閾值模型’解釋了用戶是否繼續瀏覽的隨機決策過程。”羅平解釋說。

那么問題來了,提高圖片內容和質量可否刺激用戶,延長瀏覽時長?答案是否定的,“數據顯示,當用戶點擊了五張圖片之后,翻頁概率總會達到峰值,當他點擊更多圖片之后,翻頁概率反而降低了,因此高質量的內容確實能夠增大翻頁概率,同時也具有過猶不及的效應”。羅平說。

“七頁法則”前提下,高質量內容過猶不及,App設計者如何利用這些規律設計內容呢?“我們建議設計者特別注意內容位置的敏感點,在這個敏感點,用戶的離開概率會增大數十倍,這里不要放置平淡無奇的內容和令人反感的廣告,而是投其所好,推送用戶喜歡的內容,把用戶吸引住。”羅平說,“不同的App敏感點并不一定都在第七頁,但這個位置一定存在”。

“推薦短信的價值能提高30%”

另一項工作中,在對用戶線下購買和線上搜索行為進行關聯分析時,羅平發現,購買破洞牛仔褲、耳釘的人群,網上搜索的關鍵詞大多與游戲、大學等內容相關,“搜索內容和購買意圖關聯度確實很大”。羅平說。

雖然網購火爆,但據統計,中國90%的零售業仍然發生在線下。羅平認為,行為分析的意義就在于,可以通過線上搜索得到用戶的一些購買意圖進而進行線下品牌推薦。

這其中的挑戰在于,數據來自很多不同的模態,“我們要建立一個具有解釋意義的模型,數據就不能是個黑盒子,要給商家用,還要有推薦理由”。羅平采用概率圖模型的方法,將線上搜索和線下行為進行聯合建模,用因果關系來推薦。

通過品牌聚類和關鍵詞聚類,我們可以知道,購買過母嬰用品的用戶,線上還喜歡搜索減肥操和鐘漢良的電視劇;購買過戶外用品的用戶,也是兒童用品的消費主力。“對用戶有針對性地推薦商品,每條推薦短信的價值能提高30%。”羅平說。

鏈接已復制,快去分享吧

企業網版權所有?2010-2024 京ICP備09108050號-6京公網安備 11010502049343號

  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 根河市| 蕲春县| 偃师市| 沭阳县| 开封市| 潞城市| 桂平市| 陕西省| 永年县| 达州市| 定日县| 额尔古纳市| 天峻县| 罗甸县| 鹿邑县| 浦江县| 贵州省| 齐齐哈尔市| 秦皇岛市| 拜城县| 来凤县| 甘孜县| 西青区| 盖州市| 玉林市| 金平| 商都县| 正定县| 永安市| 宝应县| 靖宇县| 洛阳市| 竹溪县| 闽侯县| 喜德县| 神池县| 梅州市| 凯里市| 锡林浩特市| 潞西市| 元朗区|