如今,企業比以往任何時候都更加認識到數據采樣和可視化是購買精確和相關的第三方數據的關鍵組成部分。在我職業生涯中檢查過的數千個數據集中,有很多都包含了最初并不明顯的重大差距或差錯。但是,審查這些數據集只是組織目前面臨的難題之一。
如果數據連買都不能買怎么辦?如果在你欲知詳情的地區沒有可信的信息該怎么辦?
隨著實體、數字、移動和交易數據呈指數級上升,很多人認為,關于所有人,所有事物或所有地方的完整的,最新的以及可靠的數據是唾手可得的。好吧,我想說的是他們錯了。這些信息根本不像他們想象的那么容易獲得。
探索對數據的需求
在你研究當今企業收集的數據的來源時,你會發現這是由人員,聯網的設備和活動生成的。人們采集它并使其變得有用,因為他們需要由此生成的數據。反過來,一旦能以合理的價格向買家提供這樣的數據,數據就會遍地開花。
當我們檢查那些具有最多可用數據的地區時,通常會發現三個共同的屬性。這些飽含數據的區域具有下列屬性:
1. 人口和企業都眾多
2. 政府數據法規較少,政府往往會參與數據的創建和發布
3. 數據采購成本低
缺少一個或多個基本因素的地區可供使用的數據就比較少,這是可以理解的。
比較全球的數據收集
我們以美國為例。美國的絕大多數州人口眾多,擁有很多工業化和數據驅動的組織,數據法規寥寥,由于《信息自由法案(Freedom of Information Act)》,這些州有大量由政府創建的可作為商業用途的基礎的數據。這一系列因素是商業數據相對于世界其它地區較能以較低的價格提供的原因。因此,關于美國人口的數據不計其數。
相比之下,非洲農村人口集中度很低,缺乏正規的現代化勞動力。如今,對于以美國為中心的數據用戶所期望的很多商業應用程序而言,關于非洲的數據很少(或者應該說可靠的數據很少)。
如果我們看看世界上人口最多,有著最為復雜的現代勞動力的國家中國,人們會認為中國的數據量肯定很驚人,而且對這些數據的商業需求也很強勁。但是,中國擁有世界上最為嚴格的一些數據法規,這些法規使得國外組織從中國獲取和輸出數據變得非法。
雖然世界上一些最大的數據驅動型組織,以及一些最新、最完整、視覺上最美觀的數據都在英國,但享有皇家著作權的數據要收取很高的費用,使大多數以美國價格為參考的人望而卻步。
因為仍有很多組織仍在為哪些數據可以共享以及以何種量級共享尋求共識,GDPR的新法規增加了使用的復雜性。
對今天數據的期望
我們發現自己處在數據收集的關鍵時刻,隨著分析和機器學習推動了越來越多的業務決策,這種情況尤甚。雖然我們的期望是整個世界在同一水平上得到反映、計算和描述,但事實并非如此。用數據描述世界會受到很多因素的影響,由于GDPR和引進和最近的公共數據安全漏洞的出現,人員和企業在共享信息方面變得比以往任何時候都更加保守。
雖然數據無形中重塑了我們構想世界的方式,但我們最大的優勢仍然領先于我們。由于組織漸漸融入了數據使用和GDPR合規性的節奏,我們可視化數據的方式肯定會發生變化。與此同時,消費者對新法規的理解也會有所不同。在我們還沒有完全對世界形成一個整體觀時,就數據共享而言,更高一級的舒適度是必須的。