互聯網,云計算,移動電子設備的信息存儲、傳輸與加工等,日益成為現代社會發展的重要技術因素。每天社會各個領域都會產生大量的數據,收集并運用科學的方法加以分析,就會從中了解到很多有意義的未知信息,這正是分析研究大數據的價值所在。英國蘭卡斯特大學官網12月9日發布消息稱,為應對大數據時代的到來,政府應在培養數據分析人才方面加大投資力度,以彌補數據收集、分析人才的欠缺。
數據分析是關鍵
最早在2010年,大數據的概念就由牛津大學網絡學院互聯網研究所治理與監管專業教授維克托·邁爾-舍恩伯(Viktor Mayer-Sch?觟nberger)提出,之后很多學者開始對大數據的概念、方法、影響力等進行研究。美國奧萊利公司(O’Reilly)技術專家艾德·杜比爾(Edd Dumbill) 在2013年3月發表的論文《大數據的意義》(Making Sense of Big Data)中提到,“直到現在,‘大數據’還沒有精準的定義,其模糊的解釋是,傳統的數據資源加上現代的數據加工過程。現有的數據特點是量大、流動快,傳統的數據處理方式已經不能滿足需求,所以為了能讓數據更有價值,必須用一種有效的方法來分析它。”
蘭卡斯特大學計算機和通訊學院教授克里斯·愛德華(Chris Edwards)也表示,“通過對大量數據的分析,研究者可以為人類的行為和意圖等方面提供有價值的見解,過去的兩年是數據大爆發的年代,培養專業的數據挖掘人才至關重要,因為大數據時代為全球發展帶來了機遇和挑戰,只有在‘數據科學’(Data Science)的支持和指導下,才能提高以證據為基礎的決策準確性。”
科學與發展網站(SciDev.Net)12月6日刊發了一篇由聯合國“全球脈搏”(Global Pulse)項目負責人羅伯特·柯克帕特里克(Robert Kirkpatrick)所寫的文章《巧用大數據獲取大視野》(Use Big Data Wisely and It Can Provide Big Insight)。文中提到,“為了發揮大數據在社會發展中的影響力,聯合國在2009年成立了‘全球脈搏’項目,希望在全世界范圍內建成幾個擁有分析大數據能力的實驗室并聯網,通過不同領域的數據科學團隊共建大數據庫分享技術和成果,以預測全球性問題。經過幾年的努力,有關機構的實驗室已經產生了成功的案例。例如,通過互聯網收集的數據了解印度尼西亞的大米價格,掌握大米價格的峰值,并預測它未來的走勢。柯克帕特里克還在文章中說,“未來大數據的熱度還會繼續,同時它也成為聯合國2015年后發展議程中討論的話題。”
理性看待大數據
當大多數學者都在積極評價大數據的發展趨勢時,一些學者則理性地分析了大數據潛在的問題。美國佛蒙特大學高級計算機中心副教授克里斯·丹弗斯(Chris Danforth)提出,“現在大數據技術的應用尚處于起步階段。大數據不能解決所有問題,只是提供一種解決問題的方法,學界也在觀察其有效性。大數據也不能替代傳統的統計學,它只能發揮補充和檢測作用。”
大數據時代的來臨必定會給社會帶來影響,但是我們不能對其盲目樂觀。就大數據可能存在的問題,澳大利亞新南威爾士大學新聞媒體研究中心教授凱特·克勞福德(Kate Crawford)在接受本報記者采訪時表示,“一方面,大數據可以被看作是強有力的解決社會頑疾的工具,為不同領域提供了新的見解;另一方面,大數據又被認為侵犯了隱私,降低了公民自由度,增加了國家和企業對公民的控制力。誰來操作這些數據,誰來管理這些數據將會是至關重要的問題。”
克勞福德還說,“大數據可能形成新的知識體系,改變傳統的知識的定義,改變原有的知識目標,把人類和社會網絡關系完全暴露出來,讓社會倫理因新工具的應用而有所改變,并可能從根本上改變學者的研究思路。”
有專家宣稱,通過運用大數據,研究者能夠把人文社會科學更加量化,但克勞福德認為,大數據的客觀性和準確性存在偏差。這些數據來源并非完全客觀,更沒有統一的衡量標準,很多時候只是人們自己的主觀意識,不能真正說明問題,特別是部分數據信息來自社交網絡平臺,其真實性無法識別,以此為依據制定政策必定導致偏差。
克勞福德表示,在大數據時代,有時數據的獲取有悖道德倫理,一些數據在使用者沒有允許的情況下被盜用。早在2006年,哈佛大學的一支研究團隊收集了該校1700名新生的社交網絡中的信息,用來研究他們的興趣和朋友關系的轉變過程,這些所謂的匿名信息后來被發布到互聯網上,供全世界學者使用和分析,但是這些數據很快就被發現涉及學生隱私。當前很少有人關注大數據時代的倫理道德問題,這一現象應引起學界重視。