有好的想法卻找不到合適的數據庫?無法下載到理想的數據格式?這部分就給大家羅列了現在流行的一些開源免費數據庫的入口:
1. The Guardian Data Store 鏈接 >>>
英國衛報的Data Store始建于2010年,其針對不同的主題分類,提供一系列的在線數據集。契合英國報業的新聞追求,這個數據商城同樣遵循著”事實是神圣的”信條。衛報的前主表Simon Rogers解釋道,他們希望能充分利用這些海量數據,向公眾提供另一類可信的新聞服務。 衛報在這個數據新聞領域一直是先驅者,他們的數據新聞作品和博客非常值得閱讀。
2. Google Public Data Explorer 鏈接 >>>
谷歌的公開數據庫始建于2010,旨在讓用戶更容易地理解和分享數據。這個在線工具基于著名的Gapminder Foundation的Trendalyzer軟件,主攻時間數據,允許用戶創建全面、簡潔、互動的可視化圖表。如果你還沒有看過數據可視界巨擘Hans Rosling的經典視頻及其產品,那你就落伍啦,趕緊補上這一課吧!
3. World Bank 鏈接 >>>
世界銀行旗下的數據銀行是最新的數據查詢工具,提供超過9,000個指標,用戶可以用它們來建立帶表格、圖表、或地圖的海關報表。這些實時報表可以被儲存、在用戶間分享、以及插入網站或博客文章中。數據銀行創始人之一、“公開數據”首席信息官員Reza Farivari的介紹視頻值得一看。世界銀行同時創建了其博客,邀請了許多這個領域的專家撰文。
4. UN Data 鏈接 >>>
世界銀行的”競爭對手”聯合國也有一個自己的數據庫,主要類別包括農業、犯罪、教育、環境、能源、艾滋病等。它們現在也開發了自己的可視化分析工具,這里有一個互聯網人口的互動圖。這個基于PHP / Javascript / MySQL的開源工具是由DrasicData開發,下載地址在此 >>>
5. BuzzData(即將下線) 鏈接 >>>
BuzzData是一個測試版的社交數據發布平臺,其CTO Pete Forde希望能提供一個平臺,讓有不同背景和技能的數據愛好者可以分享交流。盡管它們的開發者已經停止了這個網站的維護,轉做新的產品LookBookHQ,從前發布在平臺上的數據已然可以下載。它們同時提供API,方便開發者使用,這里是它們的GitHub賬號>>>。
6. OpenCorporates 鏈接 >>>
OpenCorporates數據庫主要收集可公共使用的公司信息,它提供的各種內部外部的數據庫鏈接極大地方便了使用者。數據索引是通過查詢WIPO(World Intellectual Property Organization) 唯一注冊商標的方法。OpenCorporates的另一大優點是提供公司及管理者網絡圖,通過可視的方法幫助用戶了解每個公司之間的關系以及管理者的跳槽經歷。它們也提供了API方便開發者使用。
7. InfoChimps 鏈接 >>>
InfoChiimps是由一些數據科學家和計算專家建立,致力于提供更快更簡介的大數據系統解決方案。他們的數據市場收集了上萬條有價值的數據庫信息,囊括了社交、地理、金融等各類數據,方便數據熱愛者開發出有意思的應用。
8. OECD Statistics 鏈接 >>>
OECD是一個龐大的在線統計數據庫,用戶可以創建下載自己的表格,支持多種格式。OECD的一大優點是對其數據都列出了收集方法和數據源,方便引用和查詢。數據類型上,OECD囊括了GDP、失業率、教育、金融、醫療等各種類型,大家可以先瀏覽一下用戶使用指南。
9. GeoCommons 鏈接 >>>
GeoCommons是一個很不錯的地理數據信息庫,也是ESRI社區的一員。這里有一系列的新手視頻可以先學習。它們提供免費的數據、工具和應用接口。其在線工具允許用戶實時上傳數據并使用他們的地圖可視工具,生成的交互圖可以方便地被以Iframe形式被嵌入在其它網站中,這里是它們去年做的一個全美失業率2012交互地圖。想要進一步拓展的話可以使用ArcGIS Online. GeoCommons還有一個GeoIQ開發者社區,方便大家在線交流以及查看一些優秀的作品。
10. NBA 體育數據 鏈接 >>>
這個網站可以說是最全的NBA數據庫了,統計了所有球員、教練、歷屆比賽的信息和分數,同時也有女籃、奧林匹克賽事的相關數據。現在,他們也開始收集冰球賽事、全美大學生足球賽、全美職業足球賽、全美大學生籃球賽的相關信息,他們和全美最好的體育報道媒體USA Today Sports是合作火伴。衛報之前做了一個交互信息圖 Do the tallest teams always win the NCAA championship?基于的就是全美大學生體育協會的籃球比賽數據。
11. 美國官方數據庫 鏈接 >>>
這個是美國官方政府的數據庫,鼓勵公眾參與、合作,充分利用聯邦政府的數據集創建應用、分析產品或是做科研分析,借此提高政府的透明度和開放度。他們提供的數據來自于大學、聯邦政府、州政府、非盈利組織等,可下載的文件類型超過十多種,還可以通過標簽的方式進行查詢,網站本身的界面設計也非常友好,用不同的顏色來區分類型,以卡片的形式展示不同數據。
12. 中華人民共和國國家統計局 鏈接 >>>
國內的數據現在也越來越公開了,國家統計局的網站就提供了關于國家土地、水資源、礦產、森林資源、工業狀況、人口資源等各方面情況的數據,唯一的缺點是許多數據未能統計到最新年份/月份。對國內數據感興趣的朋友可以充分利用網站上的資源。
13. 上海市政府數據服務網 鏈接 >>>
14. 北京市政府數據網 鏈接 >>>
15. 國家數據網 鏈接 >>>
其它數據庫:
DataMarket– Find, understand and share data
The Data Hub– The easy way to get, use and share data.
Knoema– Your personal knowledge highway.
Get the Data– Ask and answer data questions.
Influence Explorer– Provides overviews of political influence data for politicians.
US Census Bureau– Measures America (people, places, economy).
datacatalogs.org– A comprehensive list of open data catalogs.
Freebase– An entity graph of people, places and things from Google.
Data360– Telling compelling and data-driven stories.
Number Of– You ask, they count.
Gallup– Public opinion polls.
EveryBlock– Uncovers info on large cities contained in government databases.
Daytum– Helps you collect, organize and communicate your everyday data.
Munterbund– Graphical visualization of text similarities in essays.
\