Stack Overflow近日宣布,通過(guò)谷歌BigQuery提供它的數(shù)據(jù)集。開(kāi)發(fā)人員可以使用平常的SQL語(yǔ)句查詢完整的Stack Overflow數(shù)據(jù)集,包括帖子、投票、標(biāo)簽和徽章。使用BigQuery的REST API,開(kāi)發(fā)人員可以根據(jù)需要使用他們自選的工具導(dǎo)出數(shù)據(jù)。BigQuery上的數(shù)據(jù)集支持聯(lián)合查詢,開(kāi)發(fā)人員使用普通的SQL就可以跨領(lǐng)域獲得有用的見(jiàn)解。
除了Stack Overflow的數(shù)據(jù)集以外,BigQuery還支持對(duì)Hacker News數(shù)據(jù)集和GitHub數(shù)據(jù)集的訪問(wèn),這兩個(gè)數(shù)據(jù)集連同Stack Overflow數(shù)據(jù)集可以提供有用的見(jiàn)解。BigQuery近日還圍繞紐約市的數(shù)據(jù)增加了三個(gè)數(shù)據(jù)集,分別是關(guān)于機(jī)動(dòng)車(chē)碰撞、城市自行車(chē)旅行及311非緊急市政服務(wù)電話請(qǐng)求。BigQuery之前已經(jīng)有一個(gè)數(shù)據(jù)集,其中包含2009年到2015年紐約市的每一次出租車(chē)和豪華轎車(chē)旅行,上述三個(gè)數(shù)據(jù)集對(duì)此是一個(gè)補(bǔ)充。
當(dāng)前,BigQuery還有其他可用的數(shù)據(jù)集,其中包括氣象信息(部分?jǐn)?shù)據(jù)遠(yuǎn)至1763年)、醫(yī)療數(shù)據(jù)、350萬(wàn)數(shù)字化圖書(shū)、一個(gè)包含元數(shù)據(jù)并標(biāo)注了900萬(wàn)URL的圖像數(shù)據(jù)集、美國(guó)國(guó)稅局及美國(guó)職棒大聯(lián)盟的數(shù)據(jù)。還有一個(gè)數(shù)據(jù)集包含了世界各地的新聞和事件,每15分鐘更新一次。該數(shù)據(jù)集是由GDELT項(xiàng)目提供的。此外,BigQuery還包含Personal Genome項(xiàng)目提供的Genomics數(shù)據(jù)集、Wikipedia頁(yè)面訪問(wèn)量數(shù)據(jù)以及將近20億條Reddit評(píng)論。
感興趣的讀者可以通過(guò)BigQuery控制臺(tái)獲取Stack Overflow數(shù)據(jù)集,也可以通過(guò)reddit社區(qū)參與進(jìn)一步的討論。
查看英文原文:Google BigQuery Adds New Public Datasets