“我們每個人乘飛機時,都是自己選擇航線,這是人的智慧,但當這反映到具體的一些航程中來,就會有大量的數據記錄下來。我們從這些原始的航程記錄中,就可獲取一些航程的最優(yōu)設計方案。這就是大數據的方法。”中國人民大學信息學院院長杜小勇這樣解釋什么是“大數據”。
銀監(jiān)會日前宣布,正式批準三家民營銀行的籌建申請,其最大亮點就是互聯網公司騰訊的入選。而互聯網公司做銀行當然要有自己的看家本事,大數據或被作為其最強有力的武器。同時,今年“大數據”還首次被寫入政府工作報告:要設立新型產業(yè)創(chuàng)業(yè)創(chuàng)新平臺,在大數據等方面趕超先進,引領未來產業(yè)發(fā)展。
其實,大數據的應用早已無處不在,利用網購數據授信買車;通過博彩和球隊比賽數據預測世界杯;依據觀眾數據來打造的互聯網電影;就連今年全國高考語文,多省高考作文題,被“百度大數據”預測命中……你能想到的和想不到的都在被數據包圍,未來大數據對人們生活的顛覆性影響將堪比互聯網帶來的猛烈沖擊。
釋疑
大數據助互聯網公司做銀行
銀監(jiān)會上周五宣布,已正式批準三家民營銀行的籌建申請,其最大亮點就是互聯網公司騰訊的入選,而首批落選的阿里也在摩拳擦掌。很多人可能比較疑惑,互聯網公司憑什么做銀行?
記者了解到,深圳前海微眾銀行將結合互聯網,提供高效和差異化的金融服務。以“普惠金融”為概念,主要面對個人或企業(yè)的小微貸款需求。未來會利用互聯網平臺開展業(yè)務,依托平臺,與其他金融機構合作開展業(yè)務。
生硬而有繁瑣的“表述”的背后,其實就一句話,要用“互聯網平臺”滿足“小微貸款需求”。這不禁讓人聯想到此前被央行叫停的騰訊和阿里“網絡信用卡”,該業(yè)務是一種運用大數據技術機選并即時調整授信額度的網絡數字信用卡,而發(fā)放的對象就是從傳統銀行拿不到貸款的“屌絲”。這讓我們看到了“互聯網”銀行產品的“雛形”。
而上周阿里宣布,和中行、招行、建行等7家銀行深度合作,也不失為“互聯網銀行”服務小微企業(yè)的一次有益探索,其為中小企業(yè)提供基于網商信用的無抵押貸款,最高授信額度1000萬元。電商起家的阿里,將平臺擁有的數萬家企業(yè)交易數據開放給銀行,降低銀行貸款風控成本的同時,亦為苦于無法自證信用的中小企業(yè),提供了第三方擔保。
這次再問互聯網公司憑什么做銀行?就再清楚不過了,沒錯,就是大數據。
案例
百度大數據預測世界杯淘汰賽結果全對
那么,什么是大數據?枯燥的名字解釋可能會讓很多“技術盲”望而卻步,中國人民大學信息學院院長杜小勇在騰訊互聯網與社會研究院主辦的“大數據連接的未來”高峰論壇上給出了一個非常鮮活的解釋,“我們每個人乘飛機時,都是自己選擇航線,這是人的智慧,但當這反映到具體的一些航程中來,就會有大量的數據記錄下來。我們從這些原始的航程記錄中,就可獲取一些航程的最優(yōu)設計方案。這就是大數據的方法。”
大數據又如何連接未來?舉個例子,百度在世界杯期間準確預測德國奪冠,也是唯一一家通過大數據準確地預測了比賽結果。百度是如何通過大數據進行預測的呢?
百度大數據研究院特別派遣了資深數據科學家團隊,利用百度大數據全面搜索過去5年內全世界987支球隊的3.7萬場比賽數據,并與國內著名彩票網站樂彩網、歐洲必發(fā)指數獨家數據供應商Spdex等公司建立數據戰(zhàn)略合作伙伴關系,將博彩市場數據融入預測模型中,構建了本次“世界杯預測”產品的足球賽事預測模型。
該模型共涉及19972名球員和1.12億條相關數據,所參考的數據包括百度搜索數據、球隊基礎數據、球員基礎數據、賠率市場數據等,所分析的球隊不僅包括207支國家隊,還囊括了歐洲、南美、亞洲等聯賽俱樂部及低級別球隊信息。在國家隊勝負場預測上,準確率接近80%。
百度使用這個模型對2006年和2010年世界杯的淘汰賽進行了結果驗證,準確度接近75%。從此次巴西世界杯的比賽結果來看,這套模型的準確率要高于微軟、谷歌和高盛,其小組賽階段的預測成功率為58.33%,淘汰賽階段全部預測準確。
競爭
BAT加緊布局大數據
“大數據連接未來”,這讓互聯網行業(yè)看到了新的機遇,BAT(百度、阿里、騰訊)三大巨頭正在加緊布局,而未來的生死存亡或要在大數據一戰(zhàn)上見分曉。
很多人都比較疑惑,阿里到處撒金,動輒上十億級的大手筆投資讓人驚嘆,更重要的是“不務正業(yè)”,一會兒買足球,一會兒又搞文化,一個電商企業(yè)如此擴張讓外界覺得阿里創(chuàng)始人馬云退休后“很不著調”。事實上,那不過是“煙霧彈”,一阿里的內部中層在采訪中曾告訴北京青年報記者:“馬云的思路很明確,阿里未來要做的是數據公司。”
據了解,馬云很早就意識到大數據的價值,曾經說過阿里巴巴集團價值最高的不是淘寶,不是天貓,也不是支付寶,而是阿里平臺上所產生的大量數據。阿里巴巴、天貓、淘寶、支付寶、阿里金融產生的數據構成了個人、企業(yè)、商品和金融之間的完全數據鏈,這些數據能夠讓阿里巴巴提供更精準、高效的服務,而這些數據同時也能夠給阿里巴巴帶來不菲的收入。據悉,很多天貓和淘寶的賣家都購買了數據魔方、量子衡道等基于大數據的增值服務。
如果說阿里仍爭分奪秒地搶“數據”,那么作為搜索行業(yè)老大,牢牢把住用戶上網入口的百度則加速儲備“人才”。在大數據這一前沿領域,全球的高精尖研究人才數據極為有限。李彥宏掌舵的百度也正在加大對大數據的布局,其推動成立百度深度學習研究院,并親任院長,吸引了一大批世界級科技精英的加盟,比如前Facebook資深科學家徐偉、美國新澤西州立大學統計系教授張潼等,最近還挖來了“谷歌大腦之父”吳恩達。
擁有國內豐富的海量數據的騰訊,也在人才培養(yǎng)和引進上加大力度,上周五成立騰訊互聯網與社會研究院,啟動與人大社會管理大數據中心首批博士后共同培養(yǎng)項目,雙方將結合企業(yè)數據優(yōu)勢和高校研究力量,共同培養(yǎng)產學研相結合的高端人才,并聘請牛津大學互聯網研究院主任Luciano Floridi教授等為名譽顧問。
可以預見的是,隨著以BAT三大巨頭為首的互聯網公司在大數據方面的布局加快,未來大數據的應用場景將更加豐富,用戶也期待盡快看到由大數據連接的“未來”。
[page]
財經觀察
別讓用戶隱私“裸奔”
隨著大數據應用越來越廣泛,如何保障用戶數據的安全隱私,成為大數據應用的最大挑戰(zhàn)。法律界人士師曉丹在其題為“大數據時代的法律應對”一文中甚至明言,大數據時代人人“被裸奔”。
在大數據時代,每個人都是數據的貢獻者,當你瀏覽網頁、網購、掃描二維碼、微博、微信以及安裝手機APP時,你的個人信息、消費習慣、偏好,甚至你的社交圈子,就已經被大數據分析工具捕獲。大數據分析工具使智能、高效地處理龐大數據成為現實,但同時它也能嗅探到你的所有信息,我們的城市在變得越來越智慧的同時,似乎也越來越危險了。
騰訊公司云平臺部總經理陳磊日前在“大數據連接的未來”高峰論壇上也表示,騰訊曾經對90個要求用戶用信用卡或銀行卡支付的電商網站做過安全掃描分析檢查,發(fā)現超過60個都或多或少存在安全問題,其中20多個的問題非常嚴重,存在包括盜取用戶的身份、惡意去替用戶消費等行為。
“今天我住酒店的時候,如果酒店的工作人員讓我把信用卡留下,我是非常焦慮的,因為今天我們面臨的互聯網產品里的安全問題非常多。”陳磊如此表達自己的擔心。
陳磊強調,“要做好大數據的服務,我們首先要解決的就是信息安全的問題。特別是對騰訊而言,首先發(fā)生的挑戰(zhàn)就是安全的挑戰(zhàn)。”
師曉丹也提出,大數據時代的來臨,使人類歷史仿佛突然進入了一個嶄新的世界。在大數據面前,傳統的保護手段顯得蒼白無力。傳統的保護個人信息的法律手段“告知與許可”基本失效,因為大數據的價值不單純來源于數據的基本用途,更多的源于數據的二次利用,很多數據在收集時并無意用作其他用途,而最終卻產生了很多創(chuàng)新性的用途,這些都是無法事先告知的,也就沒有所謂的事先同意了。傳統的保護個人信息的技術手段“匿名化”基本失靈。
師曉丹建議,在傳統手段無力的情況下,大數據時代個人信息保護需要新的治理思維,“告知與許可”的基本法律手段依然可發(fā)揮作用,但只適用于數據收集階段,如瀏覽網頁時普遍存在的cookie。此時應由用戶選擇是否接受數據的收集與分析以獲得更好的用戶體驗,如果用戶選擇“否”,其任何數據不得被捕獲。在數據的“二次利用”階段,可考慮設置數據使用時效機制、大數據使用者懲罰機制、新技術強制適用機制。將數據使用限制在一定時效范圍內,意味著大數據收集者不再可以永久地保留和利用數據。大數據的價值決定了個人信息保護不可能單純依賴企業(yè)自律,大數據使用者的責任只有在強制力規(guī)范下才能確保履行到位,只有嚴格的罰則才能防止企業(yè)為了利潤罔顧大眾安全。
新的時代,法律始終要有技術支撐,“匿名化”技術可更新為“差別隱私”技術。企業(yè)真正需要的是有價值的數據,而不是窺探個人隱私。“差別隱私”技術通過故意的數據模糊處理,可以實現大數據庫的查詢只顯示近似結果,而不是精確結果,挖出特定個人與特定數據點的聯系將難以實現且耗費巨大,強制推行該技術,在現階段不失為良策。