互聯網被認為是二十世紀人類最偉大的發明之一,數十年間,它迅速影響著我們每個人的生活方式,甚至思維習慣。如今,另一個新事物——大數據的誕生,被稱為是繼互聯網之后的又一次IT革命。大數據無處不在,當你晚上打開電視看巴西世界杯時,當你拿著手機玩《刀塔傳奇》時,當你用快的軟件叫一輛出租車時,無形的數據已經圍繞你形成了一個流通的氣場。大數據到底是什么?就是人們對海量的數據進行收集、挖掘和運用,并從中創造出不可估量的價值。2014年雖不是大數據元年,但在這一年里,大數據的普及和運用都達到了前所未有的高度
大數據浪潮興起
基于互聯網技術的蓬勃發展,大數據浪潮的興起顯得勢不可擋,如同一種新生能源,物聯網、智能手機、可穿戴、智能硬件等技術設備將讓數據成幾何倍數增長。思科預測,到2016年全球網絡連接的數量將接近189億,人均擁有2.5個連接。IDC則稱,到2020年全球將擁有35ZB(1ZB=1萬億GB)的數據量。據統計,2013年,全球人類每天產生的數據就達25PB,這相當于1500家國家圖書館的全部信息量之和。可以說,作為數據的生產者,個體正推動著大數據時代的到來。
在成為生活要素的同時,大數據也開始具備資產屬性,融入到政府、金融、消費、醫療等各個領域。據悉,美國已經將大數據戰略上升為國家戰略,并將對數據的占有和控制視為陸權、海權、空權之外的第四種國家核心資產。“大數據”也在2014年首次被寫入中國的《政府工作報告》,《“十二五”國家戰略性新興產業發展規劃》提出支持海量數據存儲、處理技術的研發與產業化。廣東、上海等地則在籌劃大數據管理局,更多的地方政府也在籌劃大數據產業集聚區。
與此同時,“擁抱”大數據成為不同行業發展的統一宣言。“用手機軟件測量個人運動量,每天記錄運動消耗和心跳等。對于保險公司而言,看到的是生命周期表不再是固定的65年標準模式,而是每天多參與運動,生命周期表就多變化。”天云大數據首席執行官雷濤在日前舉行的“2014中國大數據國際高峰論壇”上表示,建立在概率理論基礎上的保險,與大數據在某些方面可以稱得上一脈相承,事實上,目前在越來越多的金融領域,都能看到大數據的應用。
麥肯錫此前的一份研究顯示,金融業在大數據價值潛力指數中排名第一。銀行、證券、保險、信托、直投、小貸、擔保、征信等金融,以及P2P、眾籌等新興的互聯網金融領域,正在利用大數據進行一場新的革命。
一些金融機構已經開始摸索出自己的一套大數據運用方法。摩旗投資管理有限公司董事長劉宏表示,摩旗有自己的一套工具,每天24小時從互聯網上收集各類信息,包括財經網站、券商網站、新聞報道、評論、論壇帖子、博客、微博等,收回來之后就放在公司的服務器上做圖片。
“公司一直在演變一套算法,從里面提取對投資有用的東西。”劉宏透露,基于此的投資從今年春節以后真正開始,這個項目給他帶來的感觸很深,針對互聯網信息如何進一步挖掘,將成為公司未來一個重要的研究項目。
對此,行業人士指出,大數據不僅將讓IT行業迎來新的黃金時代,更將顛覆各行各業的競爭格局。未來,大數據的發展更是被寄于厚望。權威機構分析,未來5年全球大數據市場擁有廣闊的發展前景,復合年增長率將達到58%,其市場盈利將由2012年的50億美元增長至2017年的500億美元。
大數據跨界應用
正如上文提到大數據在金融領域的應用,當下,在幾乎所有行業領域內,都可以看到大數據的身影。進入2014年以來,大數據更是受到各界廣泛關注,已滲透到金融、醫療、消費、電力、制造以及幾乎各個行業,大數據的新產品、新技術、新服務也正在不斷地涌現。
近日,一則全國十大“最堵”城市的新聞引發熱議。新聞源自高德地圖發布的《2014年第二季度中國主要城市交通分析報告——市民躲避擁堵出行建議》,報告顯示上海、杭州、北京、重慶、深圳、廣州、福州、沈陽、成都、濟南依次為最擁堵的前十個城市。實際上,這份報告也是基于大數據。
據悉,該報告以浮動車為主要數據來源。浮動車即為從行業方面獲取數據,高德每日接收32萬量出租車所提供的數據,這已經達到全國出租車總量的30%以上,可以獲得城市交通的真實狀況。同時高德還跟交通部相關的政府部門合作,每日還接收200多萬輛物流車和客車的數據,從而獲得城市道路的一手數據。
統計下來,以單個用戶為基礎,再加上高德地圖、高德導航的3億用戶作為整個數據藍本,并配以浮動車數據為佐證,這才形成了最“接地氣”的動態躲避擁堵城市出行方案。
中國內地剛剛開始利用大數據發現問題,國外據此已經提出解決問題的方法。記者了解到,新加坡陸路交通管理局一天平均可以收集超過1300萬個易通卡交易資料,這些龐大資料每天都被傳輸進陸交局的陸路交通網絡規劃系統(Planning
for
Land
Transport
Network,簡寫為PLAN-ET),方便專家監督和改善巴士與地鐵系統。PLANET也因此成為當地最大的政府數據庫。
新加坡陸交局創新資訊與通信科技代副署長翁耀忠透露,新加波政府就是參考了PLANET的數據分析后,才推出改善巴士服務計劃:“每當乘客使用易通卡時,PLANET
便會收到地點和時間等資料。PLANET讓我們知道公共交通系統在什么時段,什么地方最擁擠,我們便會根據分析,增加巴士或地鐵趟次,讓乘客不用等那么久。我們也會在陸交局的網站上公布一些交通信息,讓公眾能避開繁忙地點和時段。”
此外,新加坡衛生部在旗下政府醫院推行的電子醫療記錄(Electronic
Medical
Healthcare
Records)也是大數據的應用例子之一。據悉,該電子醫療記錄綜合了病人的所有資料,如病情、求醫次數、處方、藥物產生的副作用等。新加坡衛生部還召集了各醫院、衛生科學局、國大、南大等機構的專家,一起分析所獲得的數據,幫助政府制定衛生與保健政策。
新加坡國大蘇瑞福公共衛生學院張毅穎副教授表示:“大數據將徹底改變整個醫療概念,從目前的醫生主導轉向個人主導。簡單來說,大數據分析就是學習許多人的經驗,并把它運用在個人上。一個出名的例子就是美國女星安吉麗娜·朱莉,她從數據中知道自己患癌概率很高,因此便主動進行預防性的雙乳房切除手術以降低罹癌風險。一名普通人現在可以通過手機檢測身體狀況,這些資料也會實時傳給他的醫生。一旦身體出現某些危險狀況時,醫生就會知道,可以馬上進行治療。”
除了上述在公共服務領域的應有,大數據背后隱藏的商業價值也正在不斷被挖掘出來。營銷人士表示,借助海量數據的分析利用,能有效幫助企業實現市場動向預測,幫助有效支持市場活動各個階段的不同商業行為決策,還能夠實現追蹤消費者行為,并對其心理甚至下一步行為實現相對精準的預測,產生更好的用戶體驗,滿足目標消費者的多元化需求。
尤其是體育賽事中,大數據的應用已很常見。比如,在今年的巴西世界杯中,騰訊通過IBM的大數據分析、云計算等技術提供社交、移動等數據分析,跟蹤并“解析”球迷心理,產出更易引發用戶共鳴的優質內容,來為用戶打造新的體育觀賽體驗。
鏈接
上海打造“大數據開放日”推動資本布局創業團隊
自今年起,上海將把每年的11月1日打造成中國的“大數據開放日”,并積極吸引、推動各類資本布局大數據創業團隊。
作為“1101中國大數據開放日”的主體活動,2014數據中國產業創新峰會暨首屆最具投資價值排行榜發布將于11月1日在上海舉行。參加此次評選的創業公司及團隊的報名活動也從即日起啟動。
根據中央對上海科技創新工作提出的定位、目標和要求,上海要向建設成為具有全球影響力的科技創新中心邁進。要達到這一目標,就要以開放的格局掌握世界科技的前沿動態,順應世界科技的發展潮流,聚焦優勢創新資源,力爭在重點領域取得突破。而大數據無疑是其中重要的抓手。
為促進大數據產業的發展,作為此次峰會主辦方的上海大數據產業技術創新戰略聯盟將通過線上和線下的聯動活動,舉辦大數據科學家訓練營,發布《2014中國大數據產業年鑒》,構建中國大數據產業圖譜。并通過創建中國大數據最具投資價值排行榜,尋找大數據最具潛質的創新力量,搭建嫁接大數據領域創新力量與潛在資本的標桿平臺。
眾人科技創始人談劍峰表示,本次活動亮點之一是將全面盤點大數據產業情況,深度挖掘大數據時代里的創新力量,探索大數據安全解決之道,讓資本對接創意,讓數據創造價值,讓安全護航創新,從而培育出互聯網時代里的下一個顛覆力量。也許下一個馬云就將出現在2014年中國大數據最具投資價值排行榜的榜單里。
據介紹,由寬帶資本董事長田溯寧、北極光創投創始人鄧鋒、啟明創投創始人鄺子平、中路資本董事長陳榮、真格基金創始人徐小平等10位專注于大數據領域的國內著名投資人和投資機構以及國內領先的信息安全技術企業眾人科技創始人談劍峰等業界大佬組成的私董會,將全程參與峰會并評選出首屆中國大數據最具投資價值排行榜。
大數據面臨諸多挑戰
在為人類發展提供新機遇的同時,不容回避的是,大數據發展也面臨許多挑戰。數據垃圾、數據安全、數據封閉等問題,都是業界認為可能會阻礙大數據正常發展的不利因素。
“隨著大數據的應用,個人隱私也面臨著前所未有的挑戰。”國泰安金融教育集團執行總裁王春雷表示,更多關于大數據的課題,需要更深入地進行研究、探討和交流。對此,有行業人士指出,大數據來源于人們日常生活之中,包括網頁瀏覽記錄、購物信息、聊天信息以及會員資料填寫等方方面面,這些信息原本并不涉及隱私,但是多種信息整合之后再經由分析所得出的結論就難以保證不涉及隱私問題。
事實上,在某些領域,數據“裸奔”、個人隱私安全被忽視的現象早已屢見不鮮。8月初,媒體報道,警方破獲一起互聯網網絡信息泄露案,犯罪嫌疑人利用技術手段破解快遞公司網站后臺,獲取1400萬條快遞用戶信息后非法出售牟利,網上售價僅為1000余元。
犯罪嫌疑人交代,通過快遞公司官網漏洞,破解登錄用戶名及密碼之后,就能輕易進入網站后臺,然后再通過工具對網站數據庫中保存的用戶資料進行竊取。除了快遞編碼外,還詳細記錄著收貨和發貨雙方的姓名、電話號碼、住址等個人隱私信息,而拿到這些數據僅用了20秒的時間。
近年來,電商的發展帶來快遞行業的突飛猛進,也使得快遞公司成為繼互聯網巨頭之后擁有用戶個人真實信息數量最多的角色之一。目前,順豐快遞已經開始利用大數據布局O2O業務,即通過對某個區域的訂單結構分析,針對性建店和上架商品。
但是在行業飛速發展的同時,數據安全往往成為電商企業忽視的一環。快遞行業數據安全防護水平普遍較差,如網站漏洞多、修復不及時、運維人員安全意識薄弱等方面。而造成這種問題的主要原因是:因絕大多數快遞公司沒有專業安全運維團隊,甚至沒有對網站做基本的安全防護,有的快遞公司網站干脆委托給外包公司運營。
據了解,有的快遞公司也會要求安裝防火墻,甚至上線安全系統,但對于快遞公司而言,這是很大的成本。由于目前行業平均利潤率只有10%左右,各個快遞公司也只是象征性地購買一些便宜的防火墻軟件,至于互聯網公司常用的數據防泄露技術,大部分快遞公司更不會考慮。
根據統計表明,除了快遞行業,國內醫療衛生、教育培訓、旅游酒店、生活房產、人才招聘等行業的網絡安全問題也尤其嚴重,這些行業網站存在漏洞和被植入后門的比例都相對較高,而且也是黑客重點攻擊的目標。
數據“污染”被認為是數據泄露現象之后的又一大問題。武漢大學計算機學院院長胡瑞敏說,目前全球數據以每兩年翻一番的速度倍增,2007年全球傳感器獲取的數據超過了存儲總量,也就是說,要獲取一些新數據就必須丟掉舊數據,這導致大數據存儲成本高。
中國科學院院士李德仁認為,大數據“污染”較重致使其“查不準”。他說,大數據來自測量數據、記錄數據和科學計算數據。前兩類誤差較大,需有效“清洗”,就像從礦石中“煉金”一樣,才能確保查得準。
數據清洗也將成為數據服務提供商的競爭核心之一。“收集的數據中肯定會有一些'廢料',我們這款軟件可以進行清洗,確保數據分析的準確性,避免產生數據陷阱。”一家數據服務提供商的客戶經理在向記者介紹其公司的一款針對券商的數據分析軟件時重點強調。
如何掘金大數據?
在許多傳統行業著力打造大數據分析工具時,一些企業更加“激進”,甚至拋棄老本行,轉投大數據的懷抱,成為專業的數據服務提供商。如何挖掘數據的價值,讓數據轉化為實實在在的回報,是未來大數據服務提供商們的核心競爭力所在。
8月24日,曾經的高端餐飲連鎖湘鄂情發布公告,表示將全面剝離餐飲業務轉向大數據新媒體,公司名稱及證券簡稱由此前的“湘鄂情”正式變更為“中科云網”,英文簡稱CLTG。公告表示,公司名稱變更后,公司主要經營范圍變更為中餐;零售酒、飲料、煙;農業科技、電子信息技術、生物質氣化產品技術開發、計算機軟件設計、計算機系統服務等方向。
餐飲與互聯網,這兩個看上去風馬牛不相及的行業,就這樣開始了轉化。湘鄂情2013年財報顯示,當年營收8.02億元,同比下降41.19%;凈虧損5.64億元,是歷史上虧損最為嚴重的一年。顯然,轉型經營大數據,似乎是公司“求生”的一個慎重嘗試。
“去年一年多時間,湘鄂情轉型經過幾次嘗試,終于與大數據產業結緣,是因為這個產業有巨大的價值,還是一片藍海,未來我們將主要在這個領域深耕,公司將從餐飲企業轉變到大數據應用的互聯網產業。從這個轉型的脈絡來看,公司真正的轉型只有一次,就是從餐飲企業轉變到一個互聯網科技企業了。”中科云網董秘李漪對媒體表示。
對此,市場上的質疑聲從未間斷,正如羅永浩從新東方英語老師跨界做錘子手機一樣,這些看似門外漢腦門發熱的“瘋狂”舉動,極易受到鄙視。“門外漢”的標簽不等于失敗,是否有能力應對大數據的考驗,才是衡量判斷的標準,當下,對大數據的理解和未來運用上,業內也存在著諸多不同的聲音。
近日,為滿足企業用戶對實時分析的迫切需求,英特爾與SAP結合彼此在計算力和數據分析應用上的優勢,共同打造了大數據實時分析平臺。記者了解到,英特爾和SAP的經營定位,一個是全球計算力創新引導者,一個是大數據實時分析領域的領先企業。
“繼海量復雜結構數據的存儲、清洗、處理、查詢和基本的分析功能在開放架構開源平臺上得以實現后,對這些數據價值的深度挖掘,特別是實時的分析和挖掘就成了企業用戶迫在眉睫的需求。”英特爾(中國)有限公司數據中心及云計算業務產品市場總監賀曉東表示,通過實時分析技術,可以獲得更快的大數據分析速度以及更精準的分析結果,來輔助和支持企業更加高效的做出商業決策。
實時分析已經成為當下大數據產業的發展潮流之一。據悉,惠普近兩年就動用了數百億美元收購相關軟件企業,開發VerticaAnalytics平臺,讓用戶能夠大規模實時分析數據。
關于大數據實時分析的意義,來自美國的數據服務提供商——Datawatch亞太區執行總裁Karl
Mouantri
表示:“靜態的數據是有他存在價值的,但不足是在于當我們拿到靜態數據的時候已經是過時了,已經是舊的數據。而大部分的時候我們需要的是即時的數據,所以用傳統方式無法滿足大部分的需求。我們要的不僅僅是企業內部的數據,更加要得是公司外的、行業里的,正在發生的數據。”
在追求更加高效的數據處理方式的同時,如何讓數據更加直觀的呈現出來,也是數據服務提供商正在需求創新的方向。據此,行業內提出了“數據可視化”的概念。“中文里有句話叫一圖勝千言,只要看圖就能了解到關鍵信息,這是在推實時分析之外,我們公司大數據服務的另一個特色。”Karl
Mouantri表示。
顯然,大數據的“大”不僅僅指的是數據收集量大,真正體現競爭力的是所搜集數據的維度足夠“大”。國內數據服務提供商晶贊科技CEO湯奇峰指出:“更加全面的數據維度,才能夠更好將數據打上標簽整理分類,在相應的維度分析上進行更加合適的產品投放。”他表示,如何打破各自的數據壁壘,將各行業各企業手中的數據資源進行整合和互通,提供更加精準和有效的數據服務,是大家面臨的共同挑戰。