摘要:大數據讓社會生活更智慧的同時,也把人們的生活痕跡印刻在互聯網上。人們會擔心,自己生活在四面透明的魚缸里,難有秘密。網絡安全,挑戰與機遇并存,價值與風險同在,如何趨利避害用好這把雙刃劍,將考驗人類智慧。
大數據讓社會生活更智慧的同時,也把人們的生活痕跡印刻在互聯網上。人們會擔心,自己生活在四面透明的魚缸里,難有秘密。網絡安全,挑戰與機遇并存,價值與風險同在,如何趨利避害用好這把雙刃劍,將考驗人類智慧。
世紀之初,全球化概念大熱,弗里德曼告訴人們,世界是平的。大數據來襲的今天,人們越來越感覺,世界是透明的。大數據讓社會生活更便捷的同時,也把人們的生活痕跡印刻在互聯網上。挑戰與機遇并存,價值與風險同在,如何趨利避害用好這把雙刃劍,將考驗人類智慧。
凡有井水處,皆談大數據。關于大數據,先說個段子。
必勝客店的電話鈴響了,客服人員拿起電話,通過會員卡號,顧客的住址電話一目了然。客服婉拒了海鮮披薩的點餐要求,因為顧客的膽固醇偏高。客服接著又推薦了低脂健康食譜,因為顧客上周剛從圖書館借走一本書《低脂健康食譜》。
接下來的對話更有精彩,容我錄下來——
顧客:可以刷卡嗎?
客服:對不起,您的信用卡已經刷爆了,您現在還欠銀行4807元,而且還不包括房貸利息。
顧客:那我先去附近的提款機提款。
客服:根據記錄,您已經超過今日提款限額。
顧客:算了,你們直接把披薩送到我家吧,家里有現金。你們多久送到?
客服:大約30分鐘。如果您不想等,可以自己騎車來。
顧客:為什么?
客服:根據全球定位系統的車輛行駛自動跟蹤系統記錄,您有一輛摩托車正行駛在我們店附近。
顧客當即暈倒。
希望讀者不要暈倒。沒錯,這就是街談巷議的大數據。在這個愈來愈講究用數字說話的時代,大數據的概念始終如盛夏般火熱。即使在冬季,仍會有“春運大數據”、“雙12消費大數據”這樣吸引眼睛的消息跳躍在媒體頭條。
什么是大數據
大數據這個IT行業術語,通俗點來說,就是巨量數據集合。
再具體一點?那就是麥肯錫全球研究所給出的定義:一種規模大到在獲取、存儲、管理、分析方面大大超出了傳統數據庫軟件工具能力范圍的數據集合,具有海量的數據規模、快速的數據流轉、多樣的數據類型和價值密度低四大特征。
大數據之前,人們喜歡抽樣調查,隨機抽取的捷徑。有了大數據,就可以采用所有數據進行分析處理。
比如說,一張小小公交卡。北京公交一卡通每天產生4千萬條刷卡記錄,分析這些刷卡記錄,可以清晰了解北京市民的出行規律,以有效改善城市交通。
再舉個商鋪選址的例子,對大數據概念的理解會更加一目了然。
南京路上的先施公司,是老上海永遠無法抹去的風景。1914年,僑商黃煥南去上海選址時,南京路還比較冷清,他派人到各路口,用數豆子的辦法測定人流量,最后決定在南京路北興建先施公司。
黃煥南為新店選址的辦法,當時堪稱機智。后來,人們通過統計網站拉數據的方法,費時費力費錢,還未必十分精準。而且,如果選址的范圍擴展到全國城市,個人和小團隊僅憑商業直覺和有限的知識是遠遠不夠的,這時候,就需要大數據登場了,利用商業地理數據進行商業選址及消費者地理細分讓難題迎刃而解。
打開手機地圖,我們在手機APP上的位置信息最后都進入了各大公司的后臺,人流量、人流方向、人流隨時間變化,通過實時路況或熱力圖,一目了然,這些數據,正好可以用來做新店選址。
除了地圖,還有強大的搜索引擎。當將搜索+LBS技術打通后,倘若地處城鄉結合部的上海閔行區頻繁出現“火鍋”關鍵詞搜索后,海底撈、小天鵝們可以適時考慮開家分店了。
透過選址一件事,可以看出,大數據技術的戰略意義不僅在于掌握龐大的數據信息,還在于對這些含有意義的數據進行專業化處理。換而言之,如果把大數據比作一種產業,那么這種產業實現盈利的關鍵,在于提高對數據的“加工能力”,通過“加工”實現數據的“增值”。
大數據的應用
“廣西的人最愛點贊,河北人最愛看段子,最關心時政的是山西人,最關注八卦的是天津。”
這組有趣的數據,是今日頭條根據用戶習慣得出的。上線剛4年的今日頭條,恰是一款基于數據化挖掘的個性化信息推薦引擎,目前已經累計用戶5.5億,日活躍用戶超過了6000萬,成為增長最快的資訊類客戶端。
過去是依靠人總結知識,現在可以通過系統、學習用戶的行為特征來儲存智慧。當你拿著手機每看一篇文章,你的每一次點擊和搜索,各種行為,都會被記錄下來產生數據,形成推送——這是今日頭條帶來的啟示。
還有比今日頭條更精準的算法,發生在美國明尼蘇達州。
在明州,一家塔吉特門店被客戶投訴,原因是一位中年男子指控塔吉特將嬰兒產品優惠券寄給他的女兒,一個高中生。但沒多久男子來電道歉,因為女兒經他逼問后坦承自己真的懷孕了。塔吉特百貨靠著分析用戶所有的購物數據,然后通過相關關系分析得出事情的真實狀況。
說到購物數據分析,太平洋西岸的義烏商人也毫不遜色。11月9日,美國總統選舉結果揭曉,共和黨總統候選人唐納德·特朗普贏得總統選舉,將成為美國第四十五任總統。這個多少有些出人意料的結果,其實精明的義烏人早就預測到了。
原來,美國大選大量競選的旗幟都是浙江義烏制造的。川普和希拉里兩種旗幟,誰的訂單量大,說明誰的支持度高。旗幟工廠的小老板,根據雙方競選旗訂單的大數據預測特朗普必勝,驚呆了一幫吃瓜群眾。
上述三則案例,是再真實不過的大數據運用。大數據究竟給我們帶來什么,答案不言自明。
我們就是生活在這樣一個數據時代,閱讀、購物、看病、旅游,打電話、刷微博、聊QQ、用微信,都在不斷產生新數據。大數據已經與我們的工作生活息息相關、須臾難離。
沒有人會否認,大數據時代已經來臨,并將深刻地改變著人們的工作和生活。走進KTV,點歌機推薦的歌曲都是你的“拿手菜”;開車上路,可以避開“紅蚯蚓”選擇暢通路;網上購物,電商會預判用戶的消費需求,提前在離用戶最近的社區儲備商品,大大縮短送貨時間……細細一想,都是大數據在背后幫你。
放眼世界,洛杉磯警察局和加利福尼亞大學合作利用大數據預測犯罪的發生;google流感趨勢利用搜索關鍵詞預測禽流感的散布;麻省理工學院利用手機定位數據和交通數據建立城市規劃。
有沒有小小數據在手,世界盡在掌握的感覺?
大數據技術已在交通、醫療、金融、制造、通訊、推薦系統等行業中得到了廣泛深度應用,大數據加速制造業轉型,大數據助力交通更加便捷高效,大數據驅動金融精細化運營,大數據助推精準醫療快速發展……通過運用數據來催生新的服務,這是正在實現的改變,而不再是一張畫餅。
大數據的發展趨勢
種種跡象顯示,從最初的大數據定義之爭,到挖掘大數據應用價值、協商合作方向,大數據產業已經進入務實發展階段。
務實發展也讓人們對大數據的思考漸趨冷靜:大數據盡管運用領域廣闊,也沒必要神話,它就是互聯網發展到現今階段的一種特征而已。在以云計算為代表的技術創新大幕的襯托下,這些原本看起來很難收集和使用的數據開始容易被利用起來了,通過各行各業的不斷創新,為人類創造更多的價值。
簡單來說一下云計算,這是個和大數據形影不離的“小伙伴”。
技術上看,大數據與云計算的關系就像一枚硬幣的正反面一樣密不可分。大數據無法用單臺的計算機進行處理,必須采用
分布式架構。它的特色在于對海量數據進行分布式數據挖掘。但它必須依托云計算的分布式處理、分布式數據庫和云存儲、虛擬化技術。可以說,大數據相當于海量數據的“數據庫”,云計算相當于計算機和操作系統,將大量的硬件資源虛擬化后在進行分配使用。
整體來看,未來的趨勢是,云計算作為計算資源的底層,支撐著上層的大數據處理,而大數據的發展趨勢是,實時交互式的查詢效率和分析能力,“動一下鼠標就可以在秒級操作PB級別的數據”。
科普一下,PB是較高級的存儲單位。1PB=1024TB。1TB=1024G。
之所以提到云計算,是因為,大數據與云計算的深度結合在將來會更加緊密。
自2013年開始,大數據技術已開始和云計算技術緊密結合,預計未來兩者關系將更為密切。除此之外,物聯網、移動互聯網等新興計算形態,也將一齊助力大數據革命,讓大數據營銷發揮出更大的影響力。