現在,我們可能不得不面對這樣的現實:無論你是偷偷在家里種大麻,還是偷喝了老板的好酒,別人都會知道,因為有了大數據。一起來聽聽吳軍博士講的兩個大數據的有趣故事。
2010年,美國各大媒體報道了這樣一則新聞:
在南卡羅來納州的多切斯特縣,警察通過智能電表收集上來的各戶用電情況分析,抓住了一個在家里種植大麻的人。
這件事引起了美國社會的廣泛討論:大數據能夠如何幫助我們解決過去的難題,以及這項技術對未來社會會產生什么樣的影響?
毒品問題是美國社會的一大毒瘤
到了大數據時代
私自種植毒品者的好日子就快到頭了
問題描述:毒品問題一直是美國社會的一大毒瘤
過去美國政府一直把緝毒重點放在切斷來自南美洲的毒品供應上,但仍然無法完全禁止毒品泛濫。
其中一個很重要的原因就是,提煉毒品所需要的大麻,種植起來非常容易,甚至可以自己在家種植。
美國馬蘭州巴爾第摩市當地的一些窮人把房屋的門窗釘死后,在里面偷偷用LED燈種植大麻,因偏僻荒棄,這里很快成了毒品種植者的天堂。
在環境優美,生活水準高的西雅圖地區同樣發生了這樣的情況。
在西雅圖把門窗釘起來種毒品自然是行不通的,但是毒品種植者也有辦法。
有一家人花了50萬美元,買下了一棟周圍種滿了玫瑰花的豪宅。這棟四臥兩廳的大宅子其實沒有人住,占據里面的是658株盆栽大麻。
房主每年賣大麻的收入,不僅足夠付房子的分期付款和電費,而且還讓他攢夠了首付又買了一棟房子。
類似的情況在美國、加拿大均有發生。
據估計,僅加拿大的不列顛哥倫比亞省,每年這種盆栽大麻的收入就高達65億美元,在當地是僅次于石油的第二大生意。
是否對這一類街區進行重點排查是否就能解決問題呢?
答案并不如我們想象的那么簡單。
由于種植毒品的人分布的地域非常廣,而且做事隱秘,定位這樣種植毒品的房屋的成本非常高。
再加上美國憲法的第四修正案規定“人人具有保障人身、住所、文件及財物的安全,不受無理之搜查和扣押的權利”,警察在沒有證據時不得隨便進入這些房屋進行搜查。
因此,過去警察雖然知道一些嫌犯可能在種植毒品,也只能望洋興嘆,這使得美國的毒品屢禁不止。
但是到了大數據時代,私自種植毒品者的好日子就快到頭了。
截至2011年,僅俄亥俄一個州,警察就用類似的方法抓到了60個這樣的大麻種植犯罪嫌疑人。
大數據是如何幫助警察提高定位效率的呢?
過去,供電公司使用的是老式電表,只能記錄每家每月的用電量。但是從十幾年前開始,智能電表的普及,不僅能夠記錄用電量,還能夠記錄用電模式。
因LED燈需日夜開啟,種植大麻的房子用電模式和一般居家是不同的,只要把每家每戶的用電模式和一般居家用電模式進行對比,就能很容易地圈定出一些犯罪嫌疑人。
在這個美國警察查處毒品種植的案例,我們看到了大數據思維的三個亮點:
第一是,用統計規律和個案對比,做到精準定位。
第二是,社會其實已經默認了在取證時,利用相關性代替直接證據,即我們大數據思維所說的,強相關性代替因果關系。
第三是,由于采取了機器,執法的成本,或者更廣泛地講,運營的成本,在大數據時代會大幅下降。
美國一半小型企業(包括餐館等)
壽命不超過5年
大數據如何幫忙?
大數據在商業活動中從細節到整體,再從整體到細節雙向的流動,使得我們不僅能夠利用大數據對商業進行整體提升,更能夠精確到每一個細節。
這在互聯網公司已經不是什么稀奇事,不過即使在所謂的傳統行業里,大數據也能幫助我們做到這一點。
我們不妨看看下面的例子。
戴維是硅谷地區一位創業者,他喜歡根據技術發展的大趨勢尋找特定領域里的商機。
問題描述:美國一半小型企業(包括餐館等)壽命不超過5年,酒吧也是如此。
戴維在一年里走訪了美國100多家酒吧,發現它們之所以經營不下去,除了一般所說的經營不善,更重要的是大約23%的酒都被酒保們偷喝了。
那么酒保們是如何偷喝掉將近1/4 的酒的呢?
這其實很簡單:
主要是酒保們趁老板不在的時候偷喝酒,或者給熟人朋友免費的和超量的酒飲。
比如小王是酒保,小李是他的朋友。
這天小李來到酒吧時,小王看老板不在,就給小李倒上一杯沒有算錢。甚至即使老板在,小王本來該給小李倒4兩酒,結果倒了6兩。
由于每一次交易的損失都非常小,不易察覺,因此在過去酒吧的老板必須盯緊一些,如果有事離開一些,只好認倒霉。
開過小餐館的人都會有這樣的經驗,自己是否在店里看著,對營業額的影響特別大,因此做這種餐飲買賣的人特別辛苦,稍微不注意就開始虧損。
針對酒吧老板的這些麻煩,戴維設計了一套解決方案。
改造酒吧的酒架,裝上可以測置重置的傳感器,以及無源的射頻識別芯片(RFID) 的讀寫器,然后再在每個酒瓶上貼上一個RFID的芯片。
這樣,哪一瓶酒在什么時候被動過,傾倒了多少酒都會被記錄下來,并且和每一筆交易匹配上。
酒吧的老板即使出門辦事,也可以了解酒吧經營的每一個細節。
當然,戴維提供的服務如果只是停留在這個層面,那么更像是一個“萬物聯網”(Internet of Things,簡稱 loT)的應用,與我們所說的大數據其實關系并不大。
戴維對酒吧的改造帶來了一個額外的好處,就是積累了不同酒吧比較長時間的經營數據。
在這些數據的基礎上,他為酒吧的主人提供了一些簡單的數據分析。我把他提供的服務概括為以下三個方面:
首先,分析每一家酒吧過去經營情況的統計數據,有助于酒吧主人全面了解經營情況。
在過去,像酒吧這樣傳統的行業,業主除了知道每月收入多少錢,主要幾項開銷是多少,其實對經營是缺乏全面了解的。
至于哪種酒賣得好,哪種賣得不好,什么時候賣得好,全憑經驗和自己是否上心,沒有什么分析。
戴維提供的數據分析讓這些酒吧老板首先對自己的酒吧有了準確的了解。
其次,為每一家酒吧的異常情況提供預警。
比如戴維可以提示酒吧老板某一天該酒吧的經營情況和平時相比很反常,這樣就可以引起酒吧老板的注意,找到原因。
在過去,發生這種異常情況時老板很難注意到,比如某個周五晚上的收入比前后幾個周五晚上少了20%,老板們一般會認為是正常浮動,也無法去一一檢查庫存是否和銷售對得上。
有了戴維提供的數據服務,這些問題都能及時被發現。
最后,綜合各家酒吧數據的收集和分析,戴維會為酒吧老板們提供這個行業宏觀的數據作為參考。
比如從春天到夏天,舊金山市酒吧營業額整體在上升,如果某個特定酒吧的銷售額沒有增長,那么說明它可能有問題。
再比如,戴維還可以提供不同酒的銷售變化趨勢,比如從春天到夏天,啤酒的銷置上升比葡萄酒快,而烈酒的銷售平緩等。
這些都能夠幫助酒吧老板們改善經營。