在最初的的幾篇文章中我們向大家簡單介紹了基于數據分析而作出的決策可以帶來巨大的經濟效益。那么在公益研究中,大數據又是如何體現其價值的呢?
在美國,近兩百萬形形色色的非營利組織已經構成了與政府,商業并行的第三部門。為了保證組織公信力,強化公眾監督,美國法律規定具有免稅資格的非營利組織需向社會公開其990稅表。這一政策使一些致力于發展非營利部門的研究機構,如Urban Institute,Foundation Center和GuideStar,得以收集了大量非營利組織財政及運營信息并建立起了相對完善的數據庫。對于個體捐贈人和基金會而言,這些權威機構提供的信息可以幫助他們甄選出其中最有效率,最契合他們價值觀念的組織,從而為他們的資助提供選擇。而對于非營利組織而言,大數據為其把握政策風向,調整組織內部戰略,優化組織資源提供了重要的參考依據。
為了方便公眾理解和使用大數據,數據的可視化(visualization)與信息圖表(infographic)的應用正越來越受到研發人員的重視。比如研究美國巨額捐贈的百萬美元捐贈名單(Million Dollar List),收錄了自2000年以來美國境內捐贈人及團體單筆捐贈一百萬美元及以上的七萬六千余條記錄。在它的網站http://www.milliondollarlist.org/上,訪問者不僅可以免費下載完整的數據庫,也可以根據自己的需求從數據庫中調出各類描述性圖表,比如百萬美元捐贈的年度走勢,地域分布,捐贈人類型,被資助組織類型等。如果對某一特定基金會感興趣,則可以在搜索欄鍵入該基金會名稱,查看所有由該基金會資助的百萬美元捐贈項目詳情。
百萬美元捐贈名單(Million Dollar List)網站截圖
值得注意的是,單一數據庫有時候并不能充分滿足使用者的信息需求。
任何數據庫或多或少都存在某些不足之處,比如一些變量缺失大部分數據,或者數據來源不是那么可靠,或者數據的采集和處理過程有偏差。對于研究者而言,具備理解和整合多種數據源的能力因此顯得格外重要。比如公益慈善研究領域中最權威報告之一“施惠美國” (Giving USA)即是在整合了非營利組織990稅表,宏觀經濟指數,人口統計信息, 家庭慈善行為固定連續樣本研究(Philanthropy Panel Study), Urban Institute和Foundation Center等多方數據源的基礎上,使用經濟計量學模型對于每年國內組織與個人的捐贈總量進行估測。它不僅以數據化的形式展示了公益慈善活動在美國的發展現狀,也闡釋了捐贈行為與經濟環境、消費行為、收入水平之間存在的聯系。
以大數據為基礎產生的學術研究推動了知識生產,而相關知識的累積又進一步推動了整個公益慈善領域的發展并不斷影響著政府決策,從而產生更加深遠的社會影響力。再以“施惠美國”為例。在Google Scholar上搜索Giving USA,相關記錄顯示有3250篇文獻著作引用了這一數據,話題涵蓋了經濟學,公共政策,宗教學,社會學,比較學等眾多領域,比如經濟大環境對慈善行為的影響(Drezner, 2006;List, 2011),稅收制度與捐贈的關系(Harvey & Crohan, 1988),宗教性捐贈(James & Jones, 2011),家庭捐贈(Gittell & Tebaldi,2006)以及美國公益組織發展簡史(Clotfelter & Ehrlich, 2001)。此外還有不少研究報告援引“施惠美國”的數據,將美國的公益慈善行為與其他國家做橫向比較(Bekkers & Schuyt, 2008)。
在中國,類似“施惠美國”這樣的研究生態系統尚在發展之中。非營利組織相關研究經常因數據不足或難以獲取而在實施過程中困難重重。現有的幾家數據庫,如基金會中心網和中國基金會網,在設計上也較難滿足學術研究的需求,比如基金會數據都是以單個基金會形式呈現,難以支持大規模的橫向和縱向比較,給宏觀的實證性研究帶來阻礙。據統計,2004年以來在中國核心學術期刊上發表的關于基金會的學術文章不足三百篇,其中基于大數據的實證研究不足五十篇,主要原因之一就是缺乏數據。
隨著互聯網的興起,通過網絡平臺搭建開放的大型數據庫逐漸突顯出重要的戰略意義。秉承“為美好生活洞見數據價值”的理念,Intetix Foundation(英明泰思基金會)聯絡和動員全球最頂尖的數據科學家和社會科學家,致力于通過數據科學改善人類社會和自然環境。“中國基金會研究基礎數據庫”(簡稱RICF)為基金會目前運作的主要項目之一。該數據庫由留美博士發起并與國內業界人士聯合創立及研發,面向國內外學者提供開放、免費的中國基金會原始數據并為學術研究提供信息服務。
RICF數據簡介
RICF數據主要有三個特點:第一,數據庫結構清晰、開放,易于使用;第二,全部原始數據均可免費下載,便于應用在宏觀實證類研究中;第三,數據庫通過在線協作的方式不斷完善更新。數據庫主要由六大數據源整合而成,包括基金會年報,官方網站信息,民政部公布的基金會信息,中國基金會網數據庫,基金會中心網數據庫,以及權威雜志和網站上發布的新聞和報告。這些數據源不但可信度高,同時亦可以相互補充使數據庫更加完整。
以基金會為單位,RICF數據庫到2013年底共收錄了3344家基金會的基本信息,其中包括了2763家基金會的財政與業務活動,公益收支,現金流分析,資產負債等詳細信息,涵蓋變量超過170個。用戶在網站上下載完整數據庫后,可根據自身需要選取相關變量進行深入分析。比如,利用“機構基本信息”分類下的機構注冊所在地和原始基金額,結合其他變量比如地方GDP數據,消費指數信息,研究者可以對基金會在各省市發展狀況進行評估,并分析地方經濟與基金會規模之間的關系。“公益活動情況概覽”主要記錄了善款的來源和支出狀況。其中資金來源變量方便研究者分析捐贈收入中來自自然人與法人的比重,而公益支出類變量可以測算基金會公益支出占全部支出的百分比。“資產負債表”類變量可以幫助研究者對機構的財政健康度進行評估。
RICF數據庫上線以來,訪問人次已接近5000。新華社英文版在數據庫網站上線當天就發稿進行了報道,環球時報英文版也做了轉載;《中國慈善家》雜志、中央一臺、新加坡《南華早報》均表示希望訪談主創人員。在專業團隊和在線協作的努力下,數據庫正在不斷完善和充實中。我們期望RICF數據庫能為促進中國公益事業的研究與發展增添一分助力。
RICF網站:http://ricf.org.cn/
數據庫發布及下載頁面:http://ricf.org.cn/?page_id=25
References
Drezner, N. D. (2006).Recessions & tax-cuts: The impact of economic cycles on individual giving, philanthropy, and higher education. International Journal of Educational Advancement, 6(4),289-305.
List, J. A. (2011). The market for charitable giving. Journal of Economic Perspectives, 25(2), 157-180.
Harvey, J. W., & McCrohan, K.F. (1988). Voluntary compliance and the effectiveness of public and non-profit institutions: American philanthropy and taxation. Journal of Economic Psychology, 9(3), 369-386.
James, R. N., III, & Jones, K. S. (2011). Tithing and religious charitable giving in America. Applied Economics, 43(19), 2441-2450.
Gittell, R. & Tebaldi, E. (2006). Charitable giving: Factors influencing giving in U.S. States. Nonprofit and Voluntary Sector Quarterly 35, 721-736.
Clotfelter, C. T. & Ehrlich, T. (2001). Philanthropy and the nonprofit Sector in a changing America. Bloomington: Indiana University Press.
Bekkers, R. & Schuyt, T. (2008). And who is your neighbor? Explaining denominational differences in charitable giving and volunteering in the Netherlands. Review of Religious Research, 50(1), 74-96.
作者簡介
李燕南,美國印第安那大學禮來家族公益慈善學院博士生兼研究員,主攻方向為社交媒體與公益慈善。發表文章:Red Cross Society in Imperial China, 1904–1912;公益慈善教育在美國。協作報告:Million Dollar Donors Report 2013 & 2014; A Decade of Million-Dollar Gifts; Million Dollar Ready.