導讀:近年來國內大數據炙手可熱。城市規劃與研究領域對大數據更是有頗多收集、解讀和利用的方式。本專題所呈現的是6000年城市發展大數據的生動化。
Part1:耶魯大學如何玩轉大數據——把6000年世界城市發展的枯燥數據,繪制成為一目了然的地圖,成果發表于Scientific Data之上。
Part2:耶魯大學的副研究員,也是上述論文的第一作者Meredith Reba接受訪談,揭開其小組開展此研究的來龍去脈,就數據的來源,數據準確性與可靠性,把數據繪制為地圖呈現是出于何種動機,研究中的若干有趣發現,以及未來研究方向等專門作答。
Part3:強中更有強中手。Metrocosm的Max Galka受到前述研究的啟發,使用經過數字化和地理編碼的數據集制作了一個生動有趣的視頻,讓人們三分鐘看盡6000年世界城市發展史。
就這樣,枯燥的大量數據及晦澀難懂的密碼般的注解,先是被轉化成若干地圖,又變成了直白生動的視頻。高冷大數據,瞬間動起來,人人都看得到。外行看熱鬧,權且作為歷史地理的科普;內行看門道,任由城市專家、環境專家、經濟專家、歷史學家們各自去發現興趣點。這可否能為國內大數據的開發與使用者們帶來些許啟發呢?記得看小視頻哦,相當精彩!
01——為6000年城市聚落繪制地圖
原文/ TANVI MISRA 翻譯/ 相欣奕 西南大學
耶魯大學的研究人員開展的一項嶄新研究,繪制出從公元前3700年至公元2000年之間的城市中心分布地圖。
城市如何興起?城市處于哪些位置?隨著人類文明的進程,城市發生何種變化?城市如何改變其周邊環境?
已有對上述問題的答案,但卻難以獲取。比如, 聯合國 World Urbanization Prospects僅僅追溯了自1950年以來城市人口及其分布的相關信息,因此僅能提供較近年份城市發展歷程管中窺豹的一瞥。而歷史學家 Tertius Chandler 和政治學者 George Modelski 所開展的工作則更加廣泛。 這兩位勤奮的研究者收集了遠至公元前2250年的人口與考古學記錄。但是,問題在于他們的數據以表格形式呈現,充滿著難以解析的數字和注釋。
Scientific Data 所發表的一篇新文章(參考文獻1,請聯系我們索取),嘗試把Chandler和Modelski收集的信息繪制地圖呈現。耶魯大學研究人員 Meredith Reba 及其同事把長達6000年歷史的城市數據進行數字化、轉錄以及地理編碼處理。她和合作者們對其開展的這項研究的意義表述如下:
無論是出于對重大災難作出及時響應,提供救災援助,評價人類對環境產生的影響,或是對受風險威脅的人口數量加以評估等任何目的,獲知人口和城市的地理分布情況都是至關重要的。除此之外,如果能夠針對歷史進程之中的(城市)人群的規模及位置進行地理定位,則有助于我們理解人類種群演進特征,特別可加深對于人類與環境之間互動關系的認識。
他們繪制的地圖,如下所列,展示出公元前3700年至公元2000年之間所有城市居民點首次出現在記錄中的人口數量。目前可獲得的最早記錄數據采用最暖色呈現,它們成簇分布于古代美索不達米亞平原周圍。記錄時間最晚的數據則使用藍色表示。(為了表達清晰,地圖中顯示的是城市人口數據在文獻中開始被記錄的年份,并非這些城市誕生的年份):
圖一、(Esri, HERE, DeLorme, MapmyIndia, OpenStreetMap contributors,以及GIS user community/Meredith Reba 等, Scientific Data , 自然出版集團)
這一數據集,還可幫助我們獲知城市化如何蔓延。比如,研究者們發現,城市發展的中心從美索不達米亞向西移動。耶魯大學森林與環境學院的副研究員Reba對 ResearchGate作出了如下解釋:
在中學時,我們就學到了美索不達米亞是人類文明的搖籃,而這項研究則表明,城市發展的中心隨著時間進程而發生地理偏移。這也同樣表明,城市文明的地理中心并不會恒定不變。當我們進入一個新世紀的時候,我們將經歷大規模的城市化歷程,務必要謹記于心的是:城市權力中心將不斷移動。
圖二、(Meredith等,Scientific Data, 自然出版)
當然,撰寫這篇論文所依據的數據從任何意義上而言都不可能面面俱到。但是,研究人員認為,這畢竟是“開創性的第一步”,它引領我們真正理解城市如何誕生、如何成長、壯大,以及如何統治了整個世界。
02——研究人員繪制出6000年城市聚落地圖
原文/ Maarten Rikken 翻譯/ 相欣奕
從人類文明的搖籃美索不達米亞平原到君士坦丁堡,來自于耶魯大學的研究人員繪制出從公元前3700年至公元2000年期間的城市聚落地圖。
這項發表于Scientific Data雜志的嶄新研究成果(參考文獻1,請聯系我們索取),對揭示城市發展的歷史趨勢提供了極為寶貴的見解。我們與論文第一作者,耶魯大學的 Meredith Reba就這一研究及此研究對理解當今城市所具有的意義進行了討論。
ResearchGate: 你們采用數據繪制地圖是出于何種目的?研究中有哪些重要發現?
Meredith Reba: 我們希望去探詢若干常見的問題:那些位于肥沃的農業土地上的城市是否是歷史上發展最為快速且最大的城市?最早的大城市是否全部位于主要農業區?如果情況如此,那么對現代和未來城市化模式有何種啟發?因為城市現在已經與它們的農業基礎相互脫節。
全球平均中心(GMC),亦即世界城市人口的地理中心隨著時間發生巨大變化。GMC顯示出的是在特定時間點地區人口的中心,可用以追蹤人類聚居點的分布情況及其隨時間發生的顯著的全球變動。在特定的時期內,GMC 通常是數據集中所有城市經度和緯度數值的平均值,并使用各個城市人口數量進行加權。因此,較多人口數量的城市對于GMC而言產生較大的拉力。例如,根據美國統計局的數據,2010年美國人口的中心位于密蘇里州的得克薩斯縣,它比美國的實際地理中心偏東,因為居住于美國東部地區的人口較多。GMC提供了關于相對權力、資源使用、制度與治理水平以及經濟發展的諸多提示,因為城市人口越多,則城市為了發展和擴展對上述所列各項目的需求也就越多。
圖三、在這樣一個推力和拉力共存的體系之中,人口高度密集的海岸地區相互競爭,2010年美國的人口地理中心為密蘇里州的得克薩斯縣。
我們的分析表明,GMC從美索不達米亞平原出現了顯著的西移。
在中學時,我們就學到了美索不達米亞是人類文明的搖籃,而這項研究則表明,城市發展的中心隨著時間進程而發生地理偏移。這也同樣表明,城市文明的地理中心并不會恒定不變。當我們進入一個新世紀的時候,我們將經歷大規模的城市化歷程,務必謹記于心的是:城市權力中心將不斷移動。
圖四、Scientific Data , 自然出版集團。 Meredith Reba.
我們還基于數據集中各個城市最早記錄的人口數據繪制了地圖。圖中各個點的空間覆蓋度呈現的是最終數據集里所包含的所有城市。人口數據首次出現在記錄之中的時間最早的城市,使用紅色標出,其分布于美索不達米亞平原附近,而首次有人口數據記錄最晚的城市則使用暗藍色標記。必須提醒注意的一點是,各個城市的最早的人口數據對應的時間點,并不一定與這一城市誕生的時間點相對應。
圖五、Scientific Data , 自然出版集團。 Meredith Reba.
RG:你們是從何處獲得的數據?你們對于這些數據的準確性是否有信心?
Reba:我們使用了兩個獨立確定并公布的數據集,分別由歷史學家 Tertius Chandler和政治學家George Modelski開發出來。這兩個數據集只有文本格式可供使用,并未經過地理定位、合成或者協同處理。盡管這些數據已經公布,但卻難以使用或者獲取。
我們對數據的準確性充滿信心,但同時也承認其中存在若干錯誤,其中一小部分已經為我們發現。我們知道最終的數據集在時間和空間的分布上是稀疏的。從時間角度來看,在實測人口或者內插計算得到的人口數據之間存在差異,其時間跨度長達數百年或者數千年。而就空間分布而言,就南亞、南美、北美和非洲城市而言,其數據點同樣稀疏。數據集中中調展示的是在重要的時段里重要的全球性城市的人口數值。Chandler和 Modelski使用的一些人口插值方法也受到了批評,比如使用倍數來進行人口數據內插計算,使用士兵人數來預計城市規模,以及使用當前已經過時的考古學記錄和方法等。這一數據集的局限性在我們的文章已經清晰注明。但是,我們認為這一數據集是一個重要的開端,引領我們匯集并開發出更為豐富的全球歷史城市尺度人口數據庫。
圖六、Scientific Data , 自然出版集團。 Meredith Reba.
RG:為什么這一數據集很重要?它如何幫助我們理解城市及人口的變化趨勢?
Reba: 在使用這些數據繪制地圖之前,唯一可供使用的全球尺度的空間解析數據是聯合國的World Urbanization Prospects,針對人口大于等于30萬的地點提供了人口數據、經度和緯度,但是僅涵蓋從1950年至今的數據。而這一數據集中最早的城市聚落人口數據則回溯至公元前3700年。這一數據集可被用來對特定年份或者時代的全球人口分時段切分,以確定出較高人口密度的地區。此外還可基于現今或者過去的邊界劃定來把數據按照特定的國家、地區或者大洲進行細分。我們還可從中識別特定城市出現的人口波動情況。
例如,土耳其的伊斯坦布爾(原君士坦丁堡) 在公元1057至1453年期間經歷了顯著的人口降低過程。 在此期間,人口由大約30萬降低為4.5萬,這是由一系列的事件所導致的,比如十字軍洗劫以及瘟疫等。而就意大利的卡塔尼亞而言,因為地震以及埃特納火山爆發等等,導致在其歷史上人口發生多次波動。疾病爆發、自然災害、火災、戰爭戰亂等,都可在數據集中找到其所對應的人口變動,這些都是最好的例子,可展示地理環境如何影響城市人口并導致人口數量變動。通過對這些城市進行空間定位,我們得以更好的理解人口變化的驅動力,或者反過來,理解導致環境變化的誘因。
RG:這一數據集未來會有哪些用途?
Reba:精準識別人類聚落的規模和位置,可幫助研究人員理解人類的演化特征, 特別是人類與環境的互動關系。或者這些數據還可用于回答若干關于特定聚落興起或衰落的相關問題,或者關于城市發展與資源條件相互關系的問題。如果把這些數據與交通條件變化和城市歷史背景相互結合,則可待幫助我們獲知重大技術變化與城市密度變化之間的相互關聯。
03——6000年城市發展盡在3分鐘視頻中呈現
原文/ TANVI MISRA 翻譯/ 相欣奕
來自 Metrocosm的Max Galka使用目前最為綜合的城市數據集,制作了一部栩栩如生的視頻。
上周我撰文報道了耶魯大學牽頭開展的一項新研究,這項研究首次為大家勾勒出從公元前3700年至公元2000年之間城市聚落的分布圖。現在,Metrocosm的Max Galka使用經過數字化和地理編碼的數據集制作了一個生動有趣的視頻。
Galka所呈現的視頻正是受到Population Connection的世界人口歷史地圖的啟發,有助于讓人們更為清晰的了解在歷史進程之中城市如何崛起與擴展。
【視頻】耶魯大學可視化研究洞悉人類城市6000年發展史
這一視頻跨越6000年時間歷程,城市在Galka的世界地圖中出現的時間點,對應的是其人口初次被記載于歷史和考古學記錄所對應的年份。(而這并不一定是這些城市的誕生年份)。城市出現在歷史記錄中的時間距今越近,其在Galka地圖中呈現為越暖的色調。在地圖的底部, Galka還為相應的歷史時間點提供了幫助性背景信息。
Galka通過電子郵件解釋了他創建這一數據集的原因,并特別強調了他所發現的有趣之處:
目前可獲得的大部分數據庫僅僅涵蓋了數年,最多回溯了數十年的數據。而這個數據庫,則涵蓋了6000年漫長歷史,我之前聞所未聞。我超級熱愛歷史,所以,閱讀完這份研究報告之后,我想,如果能夠把這些數據加以可視化肯定很有意思,我們來看看數據所提供的多種別致的視角… . 最讓我震驚的是,某些中美洲城市出現的如此早,甚至比歐洲最早出現的城市都要早數百年。
編輯團隊:
原文/ Tanvi Misra、Maarten Rikken
翻譯/相欣奕 西南大學
校驗/眾山小
文獻/陳玨希