運用大數據的社科研究尚在探索之中
用數據作分析已經成為當前科學研究大趨勢。人們常常能夠看到自然科學領域學者利用各種各樣的數據解決科學難題。然而,社會科學領域學者對大數據的應用,仍在不斷探索當中。近期,美國塞奇出版社發布報告《誰在做計算社會科學?大數據研究趨勢》(Who Is Doing Computational Social Science?Trends in big data research)。報告認為,在社會科學領域中,使用大數據和運用大數據方式解決問題的學者并不十分普及,社會科學領域與大數據之間的關聯程度也還不夠,已使用大數據的學者在日??蒲兄羞€會遇到很多問題。為什么會出現這樣的情況?本報記者采訪了相關學者。
大數據吸引社科學者目光
數字化時代產生了非常多的數據源,它們可以來自社交媒體、非結構化文本、數字傳感器、財務和行政事務處理表格等,一些數據甚至已成為具有應用性的商品。有人認為,對大數據的使用是年輕學者的“游戲”,但報告結論發現,事實并非如此。報告作者之一、塞奇出版社研究方法中心研究員凱蒂·梅茨勒(Katie Metzler)在報告中提到:職業生涯與數據使用之間沒有必然聯系。
梅茨勒說,這份報告通過調查世界各地的社會科學研究者,了解他們從事的研究是否與大數據有關,以及在實際應用中遇到的困難和挑戰,總結當前社會科學領域應用大數據的趨勢。從調查結果看,社會科學研究者有興趣增強自己與大數據之間的聯系,但其中仍存在挑戰,例如,如何設計研究過程?怎樣才能獲得可靠的數據?
梅茨勒表示,起初研究人員與世界各地近50萬名社會科學領域專家取得聯系,最后收回9412份完整的調查問卷,其中有7933份來自學術界,其余的來自政府部門等。收回的問卷中較多的來自美國、英國、印度和加拿大,此外還有35個國家至少完成了50份問卷??梢哉f,此次問卷調查具有全球性。受訪者在學科分布上也較全面,包括教育學、心理學、健康科學,收回超過1000份問卷,而文學、歷史學、政治學、經濟學、哲學、人口學、犯罪心理學等也收到了問卷回復。調查結果顯示,1/3的受訪者自定義其使用過大數據或大數據方法進行學術研究。在這些學者中,約60%的人在過去12個月中使用過大數據。而在其他2/3尚未接觸過大數據的學者中,一半提到未來打算接觸大數據或未來一定會把大數據運用在其科研中;剩下的一半學者不期望接觸和運用大數據。
英國埃塞克斯大學社會學研究方法中心教授尼克·阿勒姆(Nick Allum)在接受本報記者采訪時表示,從報告結論中可以看出,社會科學領域中對大數據的使用并不是很普及,這可能與社會科學學科有關。可以預見,那些常與數據打交道的學科,如社會學、統計學、經濟學等可能會應用大數據,而哲學、歷史學、文學等學科幾乎用不到大數據。其實,使用大數據可以從另一個視角打開科研新思路,因此,未來如何讓那些看起來與大數據不大相關的學科應用大數據至關重要。阿勒姆表示,要想采用以大數據為基礎的學術研究方法,需要更加了解大數據,以及數據科學的內涵。
內容摘要:大數據吸引社科學者目光數字化時代產生了非常多的數據源,它們可以來自社交媒體、非結構化文本、數字傳感器、財務和行政事務處理表格等,一些數據甚至已成為具有應用性的商品。探索之路依舊充滿障礙埃塞克斯大學社會學研究方法中心學者安潔拉·丹曼(Angella Denman)表示,從自然科學研究者處理大數據的方式看,他們可以從事先設計好的儀器中接收到原始數據和信息,這些數據是他們想要的,符合他們的預期,是其科研成功的關鍵。很多學者想要嘗試將自己的研究與大數據關聯起來,一旦數據不準確或有缺陷,就會導致整個研究失敗,這對學者來說是一個非常困難的選擇。
關鍵詞:學者;應用;社科;探索;使用;研究方法中心;學科;運用;社會科學研究者;問卷
作者簡介:
探索之路依舊充滿障礙
埃塞克斯大學社會學研究方法中心學者安潔拉·丹曼(Angella Denman)表示,從自然科學研究者處理大數據的方式看,他們可以從事先設計好的儀器中接收到原始數據和信息,這些數據是他們想要的,符合他們的預期,是其科研成功的關鍵。而社會科學領域學者往往更多或者只能從其他地方,如企業、政府、網絡等渠道挖掘和分析數據,但這些數據收集的最初目的大多與學者應用的目的不同。例如,一些社交網站最初并不是為了收集個人相關信息而建立,其目的僅僅是為了協助人們交流和聯系。
丹曼認為,數據來源有限是社會科學領域中大數據應用范圍不廣的主要因素之一。這一觀點在報告中得到了印證。報告提出,在使用過大數據的學者中,他們使用過最常見的數據,首先是不同政府部門收集來的數據,包括衛生、教育或收入等;其次是社交媒體中的數據;最后是一些商業數據。數據來源非常有限,學者即便獲得了數據,還需對其拆解和分析,找出可以使用的數據非常困難。同時,需要非常專業的數據分析軟件或相關專業人員幫助,這也增加了學者的使用難度。在很多情況下,社會科學研究資助基金申請困難且有限。很多學者想要嘗試將自己的研究與大數據關聯起來,一旦數據不準確或有缺陷,就會導致整個研究失敗,這對學者來說是一個非常困難的選擇。
盡管大數據研究可能作為社會科學發展新的方向,但探索之路依舊充滿障礙。因此,現在也是社會科學發展的一個轉折點,社會科學發展需要更多新的技能、研究方法和計算工具等。社會科學領域的專家已經準備好應對未來可能面對的挑戰,使社會科學知識真正應用于社會發展中。