“大數據”怎樣改變生活
新聞背景
大數據,現在越來越成為了一個很時髦的詞匯。有人把大數據形容為未來世界的石油,有人宣稱掌握大數據的人可以像上帝一樣俯瞰整個世界,美國政府甚至已經把對大數據的研究上升為國家戰略。日前,由中國科協舉辦的“科學家與媒體面對面——大數據離我們生活有多遠”活動中,有關專家為我們介紹了大數據對未來生活的影響。
我們生活在一個充滿“數據”的時代,這里的“數據”,并不僅僅指數字,理論上講,一切可以以文件形式儲存于計算機硬盤的東西,包括數字、文字、圖像、聲音、視頻等,均可稱為“數據”。我們打電話,使用微博、QQ、博客等社交工具,都是在不斷增加著社會總體數據量。
據權威預測,未來每隔18個月,整個世界的數據總量就會翻倍。IBM的研究稱,整個人類文明所獲得的全部數據中,有90%是過去兩年內產生的。
數據,除了它第一次被使用時提供的價值以外,那些積累下來的數據海洋并不是無用的廢物,它還有著無窮無盡的“剩余價值”,關于這一點,人們已經有了越來越多的認識。事實上,大數據已經開始并將繼續影響我們的生活,下面我們不妨試舉幾例。
精準廣告投放已很普遍
很多女性可能有這樣的經歷,使用某瀏覽器在淘寶、京東等購物網站上購買過一本關于懷孕的書籍后,在之后十個月左右的時間里,你的瀏覽器兩側的廣告欄里不斷出現懷孕所需要的東西,如營養食品、對胎兒無影響的孕婦用藥、胎心監測儀、體溫計、血壓計等產品廣告,登錄原來的購物網站,也會在首頁向你推薦這類產品。而且,在十個月之后,你會發現,以上這些廣告開始變成嬰兒用品了。
你以前可能對瀏覽器廣告非常討厭,但對這類廣告,你卻欣然接受,因為它推薦的產品正是你所需要的。這實際上就是大數據應用的一個簡單案例。你的瀏覽經歷已經被瀏覽器和電商所記錄,通過對用戶瀏覽記錄進行大數據分析,就可以推測出你目前是一種什么狀態,今后又將經歷哪些狀態,于是,專為你定制的廣告就在你需要的時候出現在你的眼前。
大數據最本質的應用就在于預測,即從海量數據中分析出一定的特征,進而預測未來可能會發生什么。實際上,上述例子僅僅是大數據應用的最初級階段。因為它所涉及的數據的范圍并不廣泛,其分析原理也非常簡單。而如前言所述,大數據有數據量大、數據多樣性等特征,實際是將各個維度的數據進行綜合分析進而進行一定的預測。當不同的數據流被整合到大型數據庫中后,預測的廣度和精度都會大規模的提高。例如,當一個數據庫從不同的數據來源獲得了你使用手機的時間和地點、信用卡購物、銀行卡電子收費系統、使用QQ等聊天工具的對象、你的QQ好友關系圖、你在新浪微博、騰訊微博的收聽及被收聽關系圖譜、你交納的水、電、燃氣費等各方面的數據,數據分析師就能通過匹配獲得你生活的不同側面。通過大數據,數據分析可以發現各種各樣的關聯。通過分析,可以發現你多方面的需求,并不僅僅是諸如懷孕書籍和尿不濕之間的簡單關聯了。在數據足夠“大”的情況下,你生活中幾乎所有的需求都可能會被預測出來。例如,從數據分析出你可能會約會,于是會向你推薦衣服;從數據推測出你會出去旅游,于是向你推薦相關裝備及旅行方式等。
醫療衛生體系會更加精密
通過分析大量用戶的搜索記錄,比如“咳嗽”、“發燒”等特定詞條,谷歌公司能準確預測美國冬季流感傳播趨勢。和官方機構相比,谷歌能提前一兩周預測流感爆發,預測結果與官方數據的相關性高達97%。2009年,在甲型H1N1流感爆發的幾周前,谷歌的工程師們公開發表了一篇論文,不僅預測流感即將爆發,并且其預測還精確到美國特定的地區和州。這讓人們感到十分震驚。準確預測流感疫情,說起來并不復雜,谷歌一直致力于對用戶檢索數據的分析。用戶求醫問藥等搜索數據可謂海量,把這些數據再拿來與美國疾控中心往年記錄的實際流感病例信息相比對,就幫助谷歌作出了準確預測。
在日本也有相似的應用,日本國內有一個網站,你只要打開這個網站用自己的社交網站賬號登錄,就可以在短時間內通過數萬條社交網站記錄找出可能感冒的人,并通過過去的感冒情況和今日的感冒情況進行分析,另外該程序還會結合氣溫和濕度的變化來預測將來感冒的流行情況,并制作一個“易感冒日歷”。目前,此類服務正在日本陸續展開。
對個體而言,大數據可以為個人提供個性化的醫療服務。過去我們去看病,醫生只能對我們的當下身體情況做出判斷,而在大數據的幫助下,將來的診療可以對一個患者的累計歷史數據進行分析,并結合遺傳變異、對特定疾病的易感性和對特殊藥物的反應等關系,實現個性化的醫療。還可以在患者發生疾病癥狀前,提供早期的檢測和診斷。早期發現和治療可以顯著降低肺癌給衛生系統造成的負擔,因為早期的手術費用是后期治療費用的一半。
個性化教育可能真正實現
在傳統教育模式下,分數就是一切,一個班上幾十個人,使用同樣的教材,同一個老師上課,課后布置同樣的作業。然而,學生是千差萬別的,在這個模式下,不可能真正做到“因材施教”。
舉例來說,一個學生考試得了88分,這個分數僅僅是一個數字,它能代表什么呢?88分背后是家庭背景、努力程度、學習態度、智力水平等,把它們和88分聯系在一起,這就成了“數據”。大數據因其數據來源的廣度,有能力去關注每一個個體學生的微觀表現——他在什么時候開始看書,在什么樣的講課方式下效果最好,在什么時候學習什么科目效果最好,在不同類型的題目上停留多久等等。這些數據對其他個體都沒有意義,是高度個性化表現特征的體現。同時,這些數據的產生完全是過程性的:課堂的過程,作業的過程,師生或同學的互動過程……而最有價值的是,這些數據完全是在學生不自知的情況下被觀察、收集的,只需要一定的觀測技術與設備的輔助,而不影響學生任何的日常學習與生活,因此它的采集也非常的自然、真實。
在大數據的支持下,教育將呈現另外的特征:彈性學制、個性化輔導、社區和家庭學習、每個人的成功……大數據支撐下的教育,就是要根據每一個人的特點,解放每一個人本來就有的學習能力和天分。
延伸閱讀
個人隱私保護 一道能邁過的坎
看了前面這些,讀者可能要擔心了,大數據包含有包羅萬象的數據,其中不少數據涉及個人的職位、年齡、身體狀況、消費水平、旅行習慣等隱私,那么,在大數據時代,個人隱私能夠得到保護嗎?答案是,只要國家相關部門實時推進隱私保護,企業主動落實隱私保護責任,大數據產業在飛速發展的同時并不會對民眾隱私產生威脅。
在大數據產業中,有兩個基本的作法,一是符號化。符號化是指識別用戶的時候,識別的僅僅是一個“符號”,這個符號與真實信息并不相關,系統通過一定的算法能夠知道多次登錄的是同一個用戶,但并沒有辦法反推出這個人是誰,因此,電話、住址等信息都沒法與本人關聯起來。二是用戶特征。用戶特征意味著在大數據時代企業感興趣的往往是這個用戶的特征,而不是家庭地址、電話號碼等真正敏感的信息。例如,系統需要了解本科以上學歷、月收入10000元以上、已婚等這樣一個群體,只需要找出符合這些特征的人的特性,并不關心這個人是誰。這樣也不會造成隱私的泄露。
當然,這些原則性問題有賴于政府推動、企業自律。但我們相信,為大數據產業的健康發展,相關部門,相關企業一定會高度重視這一問題。
【想看更多互聯網新聞和深度報道請關注速途網官方微信。(微信號:速途網)】