近年來,伴隨手機的普及以及移動互聯網技術的迅猛發展,手機使用中產生的大數據資源的研究與應用價值受到學者們的重視。然而,合理開發、利用手機大數據的邊界尚未確定,海量數據仍處于“沉睡”之中。
忠實記錄用戶行為
據2016年1月工信部發布的2015通信運營業統計公報,中國移動電話用戶總數達13.06億戶。如此規模的移動電話用戶群體將產生海量數據。同濟大學建筑與城市規劃學院副教授鈕心毅介紹,手機數據包括通話詳單數據、話務量數據以及反映手機用戶在網絡活動的信令數據,其中信令數據就是典型的大數據。江西財經大學管理哲學研究中心主任黃欣榮告訴記者,“信令數據產生來源主要有社交數據、瀏覽數據、行為數據、消費數據等”。
那么,手機大數據具有怎樣的特點?“手機產生的大數據除了具有大數據一般特征外,它更廣泛、真實、全面,也更隱私。”西安交通大學公共政策與管理學院教授杜海峰分析說,手機是人們生活的傳感器和記錄器,一個手機的數據對應一個人真實的生活軌跡。手機記錄了真實的社會關系與社會活動,可以更準確、系統地反映社會現實。據中國互聯網絡信息中心發布的第37次《中國互聯網絡發展狀況統計報告》顯示,截至2015年12月,中國手機網民規模達6.20億。在黃欣榮看來,每位手機機主都是數據生產者,這些數據反映出手機已成為目前最常見的智能終端,是最便捷的數據生成器,忠實地記錄了機主的日常生活。
有待開采的研究資源
手機大數據與人們生活息息相關,學者們將其看作是有待開采的寶貴資源。目前國際學術界已有研究人員正在探索如何使用手機數據來普及金融服務、追蹤流行病的傳播等問題。
黃欣榮認為,具體數據能夠精確描述出研究對象,由此建立數據模型,有助于提煉出具有普遍性的一般規律。人文社會科學的客觀數據采集一直是個難題,通過數據化來研究人的思想和行為是人文社會科學試圖拓展的研究視域。手機記錄的信息數據,使與人相關的數據獲取有了客觀、可靠的來源。
中國社會科學院哲學研究所研究員段偉文表示,手機大數據為社會學、經濟學、傳播學、新媒介研究等領域提供了新型經驗數據源和實驗平臺,有利于促進人文社會科學研究的進一步數據化,推動數據社會科學研究深入發展,形成一些基于數據的、跨學科的人文社會科學學科群,如事件歷史學、群體認知社會學、輿論與情緒傳播學、新媒介場景整合地理學、移動媒介語言學等。
杜海峰所在的研究團隊曾嘗試通過手機大數據分析中國社會人際互動的規律。此外,中國科學院主持的相關流動人口監測項目也曾使用手機作為終端來獲取流動人口的相關數據。鈕心毅所在的研究團隊近年來致力于探索使手機數據成為城市規劃基礎數據的可行性。“當我們用手機信令數據做城市功能分區的識別和評估時,它會帶來新的視角,我們可以觀察居民的就業點、居住點、休閑活動規律。大尺度、對應人口分布、對應居民活動范圍是三個適合手機信令數據應用的前提。”鈕心毅介紹說。
數據開發須遵守法律與倫理
手機大數據當前面臨著隱私邊界等棘手難題,而對于手機數據的獲取和使用也有嚴格的監管措施。在鈕心毅區分的三類手機數據中,通話詳單數據公認為個人隱私,運營商不會提供,學者們的研究亦不會使用;話務量數據不涉及隱私,運營商相對愿意提供,但這個數據看不到個體行為,只能在一定程度上反映城市活動,目前國外研究者使用的最多也是這類數據;信令數據能反映居民日常活動的時空軌跡,在城市規劃、交通、旅游等領域應用價值很大。運營商已對其進行了加密和脫敏處理,但要如何利用這些數據,目前尚無定論。黃欣榮表示,手機數據涉及太多信息,但如果不能被利用,會形成數據孤島,不符合開放、共享的大數據時代精神。因此,手機大數據必須得到開發和利用,但需要守住法律與倫理的底線。
據段偉文觀察,一方面,目前國內對大數據開發利用中的個人隱私權、知情同意權、信息接近權、信息知曉權等方面的研究較為薄弱,法律表述不清,法理基礎不明。另一方面,人文社會科學的研究倫理闕如,相關研究遠未展開。人文社會科學研究必須應對數據倫理和數據隱私權問題,既要體現社會現實,也要考慮與國際共識接軌。
鈕心毅表示,從數據倫理來說,學界基于手機大數據的研究針對總體而不針對個體,但應盡快對大數據進行立法,明確規定對手機信令數據的開發利用界限。杜海峰建議,針對有關國家發展戰略的研究,相關政府部門應精心組織,從手機系統中有目的地收集數據,經過脫敏處理后,有組織地發布給相關科研機構使用。同時需要加強科研人員自身的素質和學術道德,使科研人員對數據敬畏,對個人隱私敬畏。此外,所有研究應該具備公益性質,同時應加強輿論引導,使民眾充分認識到手機大數據的科學價值和社會價值。