當今肆虐中東多國的ISIS將“伊斯蘭恐懼癥”帶到了全世界。但在這塊土地上,一千多年前存在過一個強大的阿拉伯帝國,帝國甚至把版圖延伸到了整個印度西北部,哈里發(fā)的軍隊從印度人處發(fā)現(xiàn)了一種先進的數(shù)學符號體系,后來這個體系隨著帝國的鐵騎和商隊被擴散到了整個亞歐大陸,并催生了后來歐洲先進的數(shù)學體系,這一奠定了近代工業(yè)與航海基礎(chǔ)的瑰寶,當然這個數(shù)學符號體系就是現(xiàn)在大家熟知的阿拉伯數(shù)字。
時光回到70年前,二戰(zhàn)在摧殘人類文明的同時,也間接推動著科技以數(shù)倍于和平時代的速度前進。戰(zhàn)后計算機很快就出現(xiàn)了,使得過往一直困擾著人類的信息存儲與計算問題得到完善的解決。數(shù)據(jù)逐漸成為了治理所有產(chǎn)業(yè)的核心基礎(chǔ)之一,數(shù)據(jù)科學以不可思議的方式改變了工業(yè)界和日常生活。
以上是兩個有著極端跳躍性、并永遠改變?nèi)祟惷\的“奇點”,而隨著當前人類總數(shù)據(jù)正在經(jīng)歷著指數(shù)式的爆發(fā),也許在不久的將來,我們將會見證數(shù)據(jù)史上的第三個“奇點”。
但是如今,指數(shù)爆發(fā)的數(shù)據(jù)實際上并沒有匯聚為一片藍海,而是以碎片割裂的方式分散在不同地方。“一盤散沙”的數(shù)據(jù)難以獲得最大的價值,只有讓數(shù)據(jù)流動起來,保證數(shù)據(jù)能被具有相應“煉數(shù)成金”稟賦的人加以利用,才能催生不可估量的價值。
在這個背景下,數(shù)據(jù)交易成為了如今炙手可熱的話題,但又由于數(shù)據(jù)本身的特征,世界上也許沒有第二種商品的交易會像數(shù)據(jù)交易那樣需要具備想象力和創(chuàng)造性。本文取名數(shù)據(jù)交易史話其實不太恰當,因為數(shù)據(jù)交易是一條艱難的道路,而且沒有太多的歷史經(jīng)驗可借鑒,本文希望以不太長的篇幅,將數(shù)據(jù)交易這個課題做系統(tǒng)性的剖析,同時竭力探討數(shù)據(jù)交易中的個人隱私保護、數(shù)據(jù)定價、交易成本降低、數(shù)據(jù)交易市場、保障數(shù)據(jù)不被二次出售等有趣的關(guān)鍵點。
作為開篇,本文首先會介紹數(shù)據(jù)交易的本質(zhì)特征,了解這些特征就能夠感受數(shù)據(jù)交易究竟難在什么地方。
第一部分 數(shù)據(jù)交易的4個本質(zhì)特征
數(shù)據(jù)的本質(zhì),是蘊含在數(shù)據(jù)背后的信息和知識,與普通商品流通有著完全不一樣的特征,對于數(shù)據(jù)交易這個嶄新的事物,采取傳統(tǒng)的貼價格標簽出售的方式,是無法將數(shù)據(jù)交易的蛋糕做大的,因此我們需要首先深入探索,數(shù)據(jù)交易本身的固有特征。
首先,數(shù)據(jù)是一種無形、能反復交易的物品。數(shù)據(jù)的交易,與傳統(tǒng)商品流通或者互聯(lián)網(wǎng)的流量交易與變現(xiàn)的最大區(qū)別就是數(shù)據(jù)的可反復交易性。一項商品賣給了A客戶以后,就不能同時賣給B,但數(shù)據(jù)從理論上說是可以同時賣給N個不同的買家,因為數(shù)據(jù)出售的邊際成本接近零,在這個特征上,與數(shù)據(jù)非常類似的有數(shù)字內(nèi)容。數(shù)字內(nèi)容包括了軟件技術(shù)、游戲、電影、唱片等擁有明確版權(quán)的無形商品,他們的共有特征同樣都是內(nèi)容制作需要大量的成本,但后續(xù)銷售的邊際成本接近零。
作為一個有趣的類比,我們不妨看看蘋果iTunes里面,所有者是如何為自己的數(shù)字內(nèi)容定價的。在定價理論里,供應量無限的商品,其最優(yōu)定價是客戶群的平均客戶感知價值(CPV,即買家內(nèi)心感知該商品的實際價值,相當于買家意愿中的最高出價)。下圖是iTunes中一款專業(yè)圖形比對軟件Kaleidoscope 2在歷史不同價格(橫坐標,美元)的總體收益分布圖,通過反復調(diào)價,Kaleidoscope 2找到了價格位于60.60美元與65.28美元之間、能達到利潤的最大化的定價最優(yōu)點。
寫到這里可能有人會說,數(shù)字內(nèi)容里面,不是有大量的應用采取免費策略的嗎?如果數(shù)據(jù)同樣采取免費策略,最終建立一個全人類的共享大數(shù)據(jù)云,并免費為所有人開放,那豈不是成為造福一方的千古功績?的確在應用里免費使用、后向變現(xiàn)已經(jīng)成為了最重要的一種業(yè)態(tài),原因在于免費應用通過會員制、流量變現(xiàn)等方式能構(gòu)筑嚴密的商業(yè)模式閉環(huán)。而數(shù)據(jù)則帶有準生產(chǎn)資源性質(zhì),只要能合理分發(fā)到特定的需求方,數(shù)據(jù)很容易就能轉(zhuǎn)變?yōu)閮r值。而對于一個商業(yè)模式最為關(guān)鍵的一點,就是能創(chuàng)造顯著與持續(xù)的收益,數(shù)據(jù)免費大規(guī)模共享并不是長期上總體收益最大化的模式。免費的數(shù)據(jù)共享,就如央行為每個老百姓發(fā)一張1000萬的“均富卡”,并希望能長期刺激國家內(nèi)需一樣滑稽。
而數(shù)據(jù)不適合共享的第二個原因,就是數(shù)據(jù)的價值相對性。對于數(shù)字內(nèi)容,一般都是普羅大眾都能夠接受的產(chǎn)品,比如一部電影再不符合你的口味,悶得慌時湊合看看總是可以的。但數(shù)據(jù)則不一樣,即使是同樣一個數(shù)據(jù)集,對于不同的企業(yè)其價值可能是天淵之別,而對于數(shù)據(jù)這種相對價值差異極大的產(chǎn)品定價,免費模式幾乎不可能達到經(jīng)濟上的帕累托最優(yōu)。
數(shù)據(jù)的第二個特征是數(shù)據(jù)價值的相對性。比如我有大量全國方言的語料庫數(shù)據(jù),這個語料庫對于絕大部分人而言其價值幾乎為零,但對于如科大訊飛等專門做語音識別的公司,則是能大幅度提升識別準確率的“金子般”高價值數(shù)據(jù)。另外一個例子是,假設(shè)我有整個中國13億人的興趣愛好標簽數(shù)據(jù),雖然這個數(shù)據(jù)對于幾乎所有的企業(yè)都是非常有價值的數(shù)據(jù),但實際上大部分企業(yè)只是需要其中的一部分而已,如上海的淘寶賣家只關(guān)心江浙一帶用戶的數(shù)據(jù),母嬰電商僅關(guān)注其中的女性用戶數(shù)據(jù)。讓數(shù)據(jù)需求方把全體數(shù)據(jù)買回去無疑是不符合市場規(guī)律的,數(shù)據(jù)交易需要給予數(shù)據(jù)需求方“挑數(shù)據(jù)”的能力。
上述兩個個案例,分別說明了數(shù)據(jù)總體價值在需求方的差異性,以及數(shù)據(jù)本身內(nèi)在價值分布的差異。對于大部分數(shù)據(jù)交易,使用傳統(tǒng)商品交易的方式,即供給方簡單為數(shù)據(jù)貼上一個價格標簽掛平臺出售的方式是不合適的。因為在傳統(tǒng)商品流通中,不太可能出現(xiàn)比如一本書對于買家A價值高達1萬元、但對于買家B僅值10元這樣的巨大價值感知差別。
有趣的是,傳統(tǒng)商品交易確實會存在上述的情況,比如玉石/字畫,或土地/有價證券等價值感知主觀性極強的商品交易。事實上我們已經(jīng)為它們創(chuàng)造了一種幾乎完美的定價模式,那就是競價拍賣,即需求方定價:你覺得對你而言,值多少錢就出多少價。
數(shù)據(jù)交易第三個特征是,交易的不僅是數(shù)據(jù)本身,而是知識。這個看起來非常顯而易見的觀點,實際是數(shù)據(jù)交易中最為核心的原則。在未來成熟的數(shù)據(jù)交易市場,主要交易的量會圍繞蘊含在數(shù)據(jù)背后的知識,而數(shù)據(jù)的知識發(fā)現(xiàn)KDD(Knowledge Discovery in Data)將會是數(shù)據(jù)交易市場的核心任務。而其中的道理也是顯而易見的,需求方分別把數(shù)據(jù)買回去然后做加個應用無疑是不經(jīng)濟的,更好的模式是,知識已經(jīng)由數(shù)據(jù)交易市場以云計算的形式處理好,由需求方直接購買回去使用。俗話說書本有價知識無價,而至于怎么對這些“無價”的知識進行定價出售,數(shù)據(jù)交易市場需要設(shè)計一套巧妙的機制,通過需求方定價的方式去激活市場。
在未來,數(shù)據(jù)交易產(chǎn)品化將會是重大趨勢,而數(shù)據(jù)知識發(fā)現(xiàn)KDD是其中的核心問題。正如你去谷歌搜索“數(shù)據(jù)交易”,谷歌不會粗暴地把所有含“數(shù)據(jù)交易”關(guān)鍵字的網(wǎng)頁打包為一個碩大的txt文檔返回給你一樣。
數(shù)據(jù)交易最后一個特征,是數(shù)據(jù)涉及的隱私性。目前的數(shù)據(jù)交易之所以困難,在于大部分有交易價值的數(shù)據(jù)都與用戶的個人隱私有緊密關(guān)聯(lián)。如國內(nèi)三大電信運營商雖然具備用戶全行為洞察以及跨屏數(shù)據(jù)的巨大優(yōu)勢,但在數(shù)據(jù)變現(xiàn)中腳步蹣跚,最主要原因在于用戶隱私紅線。數(shù)據(jù)交易實質(zhì)是一個復雜的“四方問題”,關(guān)于用戶隱私和四方問題本文接下來的章節(jié)會詳細介紹。
第二部分 數(shù)據(jù)交易的“四方問題”
在數(shù)據(jù)交易的具體過程中,存在復雜的四方問題,具體如下圖所示。在長期以來的數(shù)據(jù)交易探討中,我們都傾向于為求簡便,有意無意地忽略了數(shù)據(jù)的“原點”,也就是數(shù)據(jù)的當事人——用戶本身。但在現(xiàn)實當中,大部分數(shù)據(jù)尤其是行為類數(shù)據(jù),都是用戶基于與某個服務提供方(第二方)的服務或產(chǎn)品契約,在使用過程中所產(chǎn)生的。數(shù)據(jù)的當事人,即用戶在數(shù)據(jù)交易的設(shè)計與規(guī)劃中是不能被忽略的,數(shù)據(jù)交易不能被簡化為簡單的“三方問題”。而在目前國內(nèi)成立的一些數(shù)據(jù)交易所中,數(shù)據(jù)當事人并未被納入到其頂層設(shè)計之中,僅僅通過一些如“涉及用戶隱私或其他法律保護情形的數(shù)據(jù),不能交易”等條款含糊應對,這是比較可惜的地方。
在數(shù)據(jù)交易之中,之所以有用戶隱私侵犯甚至違法交易之憂,最本質(zhì)的原因是數(shù)據(jù)交易 “四方問題”是一個閉環(huán)的結(jié)構(gòu)。也就是說,取之于用戶的數(shù)據(jù),被售賣到數(shù)據(jù)購買方后,有可能被用于利或不利于用戶的行為之中。如運營商把運營商把數(shù)據(jù)售賣給征信機構(gòu),導致用戶在貸款申請中,授信額度被降低了10萬元;或電商把用戶購物興趣標簽出售后,用戶接到了大量的營銷電話。因為有這一閉環(huán)的存在,服務提供方在未經(jīng)用戶許可的情況下,單方面把數(shù)據(jù)提供給可能會為用戶帶來不利后果的購買方,無論是倫理上還是契約上都是不合適的。
倘若上述閉環(huán)并未合上,則不存在隱私侵犯的問題。如用戶個體數(shù)據(jù)被加工為各類宏觀統(tǒng)計數(shù)據(jù),如百度遷徙數(shù)據(jù),或者數(shù)據(jù)沒被用于針對用戶本身的營銷或洞察行為之中。如用戶的Netflix電影評分數(shù)據(jù)隨同NASA的最新探測器被作為人類社會行為的樣本發(fā)射到了太空,即使數(shù)據(jù)中含有了敏感的PII信息(個人身份可辨識信息),用戶也不必擔心在有生之年會因為在《獨立日》中的高評分會被外星人找麻煩。
個人隱私保護是數(shù)據(jù)交易當前的焦點問題,鑒于其中的巨大挑戰(zhàn),本文無意深入探究數(shù)據(jù)交易隱私保護的技術(shù)與方案。但實際上業(yè)界對于數(shù)據(jù)交易的隱私保護已經(jīng)有了一定的嘗試,其中在線廣告的數(shù)據(jù)交易平臺的實踐是值得我們?nèi)ネ嫖兜摹?/p>
雖然目前數(shù)據(jù)交易是非常熱的一個話題,但實際上能通過程序化形式每天開展大量數(shù)據(jù)交易的,業(yè)界里恐怕只有在線廣告的在線用戶行為標簽數(shù)據(jù)交易,這種數(shù)據(jù)交易形式被廣泛用戶RTB等競價廣告的客戶定向之中。簡單而言,DMP(數(shù)據(jù)管理平臺)會通過各種渠道聚合在線用戶的行為數(shù)據(jù),并加工為有價值的用戶標簽數(shù)據(jù),并出售給廣告主(實際為DSP)用于廣告的精準投放,從而提高廣告的投入產(chǎn)出。這種明細用戶的標簽交易形成了上述四方問題的閉環(huán),必然會帶來用戶隱私的困擾,那DMP是如何去界定與解決的?
我們以去年被Oracle收購的廣告數(shù)據(jù)管理平臺商Bluekai說明。Bluekai的商業(yè)模式主要是從各類中小主題網(wǎng)站及其他來源獲取用戶數(shù)據(jù),加工為各類用戶標簽,比如近期想買奧迪汽車的人、想去米蘭度假的人等,并出售給廣告主用于精準投放。鑒于Bluekai作為一家具影響力的DMP以及這種堂而皇之的個人數(shù)據(jù)出售方式,必然會引起數(shù)據(jù)隱私的問題,作為解決方案,Bluekai搭建了一套用戶隱私保護體系,上面明示遵守了那些法律法規(guī),明確了收集與不收集哪些數(shù)據(jù),讓使用者可以看到自己的資料是在被誰使用,并且讓用戶隨時可以選擇opt-out。
除了告知外,Bluekai還具備用戶自主opt-out機制,下圖是微軟MSN、Outlook.com以及其他微軟網(wǎng)站和應用上應用了用戶標簽數(shù)據(jù)的個性化廣告的隱私說明和opt-out頁面,用戶可自由選擇是否接受個性化廣告的投放。而在數(shù)據(jù)的收益權(quán)上,有趣的是,Bluekai甚至允許用戶選擇將因為使用自己數(shù)據(jù)獲得的收益捐給慈善機構(gòu)。
數(shù)據(jù)交易中的隱私保護是一個蘊含巨大挑戰(zhàn)的課題,本文認為其中至少有三點是必不可少的:法律層面?zhèn)€人信息及隱私立法、對用戶透明公開的正常與數(shù)據(jù)使用情況、以及用戶擁有部分數(shù)據(jù)交易收益分配權(quán)。而這些舉措毫無疑問不是市場自身能夠完善與執(zhí)行的,除了國家層面的推動以外,數(shù)據(jù)交易市場是其中最重要的推動力量。
另外,數(shù)據(jù)交易市場在上述“四方問題”中的核心定位,在于降低數(shù)據(jù)交易過程中的交易成本。數(shù)據(jù)交易市場需要具備核心能力從而最小化整體市場的交易成本,關(guān)于這點在接下來關(guān)于數(shù)據(jù)交易市場的章節(jié)將會進一步討論。
第三部分 未來的數(shù)據(jù)交易市場
數(shù)據(jù)交易市場存在的意義,在于顯著降低數(shù)據(jù)交易的交易成本,否則數(shù)據(jù)交易雙方是沒有任何理由在交易市場開展交易的。數(shù)據(jù)交易的成本,由搜尋成本、因信息不對稱導致的風險成本、議價成本(狹義的交易成本)組成。其中搜尋成本是數(shù)據(jù)買賣雙方對接需求并成功撮合所需要付出的成本;而風險成本是由于數(shù)據(jù)交易的雙方信息不對稱,所出現(xiàn)的賣方夸大數(shù)據(jù)價值、以次充好等道德風險行為;而議價成本是雙方在數(shù)據(jù)定價問題上討價還價帶來的價值損耗,大家不妨回憶本文第一部分關(guān)于數(shù)據(jù)價值的相對性的論述,就不難理解如果缺乏一套有效的數(shù)據(jù)定價機制,交易雙方會圍繞數(shù)據(jù)定價損耗大量的精力與成本。
那么數(shù)據(jù)交易中心該如何降低上述的交易成本?交易成本的最小化,是任何一個多邊平臺的最終目標,也是一個艱難的課題。本文試圖通過四個問題,從不同角度進行穿插梳理,權(quán)作拋磚引玉——
問題一:在數(shù)據(jù)交易市場,交易對象是什么?
數(shù)據(jù)交易中心中可交易的數(shù)據(jù)。可以根據(jù)上一章節(jié) “四方問題”中是否有形成閉環(huán)分為兩類:第一類是非閉環(huán)數(shù)據(jù),即不涉及任何個人隱私的統(tǒng)計性與科研數(shù)據(jù)(為方便起見,這類數(shù)據(jù)下文稱作“第一類數(shù)據(jù)”)。如各類經(jīng)濟及行業(yè)統(tǒng)計數(shù)據(jù)、用于工程及研究目的得各類如聲音語料庫、城市交通數(shù)據(jù)、匿名的上網(wǎng)行為數(shù)據(jù)等。這類數(shù)據(jù)由于不涉及到個人隱私,一般可以認為產(chǎn)權(quán)屬于所有方,采取“柜臺式”報價掛牌交易即可。
國內(nèi)數(shù)據(jù)交易平臺“數(shù)據(jù)堂”是第一類數(shù)據(jù)交易的樣板,大家可具體到這個網(wǎng)站感受一下。這類數(shù)據(jù)在交易過程中的搜尋成本相對較低,通過傳統(tǒng)的檢索技術(shù)就能快速撮合數(shù)據(jù)買賣雙方,但如何降低出售方夸大數(shù)據(jù)價值、以次充好的風險成本?有一個具啟發(fā)性的思路就是,數(shù)據(jù)交易中心可借鑒手機應用商店做法,設(shè)計激勵政策將數(shù)據(jù)供給方的角色從“出售者”轉(zhuǎn)變?yōu)?ldquo;數(shù)據(jù)長期運營者”——鼓勵供給方不斷維護、升級所提供的數(shù)據(jù),比如勘誤、定期更新數(shù)據(jù)(類似應用商店中的版本管理),激勵手段舉例如給予活躍維護數(shù)據(jù)的供給方的數(shù)據(jù)產(chǎn)品提供在平臺上更多的曝光、平臺扣起部分收入根據(jù)購買者售后投訴情況做備用賠付金等。從此以往,數(shù)據(jù)需求方不再是花錢“購買數(shù)據(jù)”而是“訂閱數(shù)據(jù)”,從而不僅能減少提供方以次充好撈一票就走的行為,也更能體現(xiàn)交易對象是數(shù)據(jù)服務的本質(zhì)。
實際上第一類數(shù)據(jù)的交易中還存在另外一個交易風險成本,那就是如何保證,數(shù)據(jù)購買方獲得數(shù)據(jù)以后,不會私下把數(shù)據(jù)重復賣給其他需求方?這個風險不解決,勢必在大范圍數(shù)據(jù)交易中,降低了數(shù)據(jù)供給方對于數(shù)據(jù)收益的預期,從而不得不提升數(shù)據(jù)售價,又反過來迫使購買方通過私下倒賣的方式降低自身購買成本,形成惡性循環(huán)。作為一個一般性思路,數(shù)據(jù)交易市場需要通過規(guī)則與技術(shù)手段提升購買方的違規(guī)成本。如嚴格的準入與會員等級特權(quán)制度,促使購買方珍惜自身交易資格避免違規(guī),另外技術(shù)手段上,可在數(shù)據(jù)中加入用于識別的隨機信息,可輕易追查出私下倒賣的會員。
而數(shù)據(jù)交易中的第二類數(shù)據(jù),是形成了“四方問題”閉環(huán)的明細用戶特征與行為數(shù)據(jù),這類數(shù)據(jù)的特點是由于涉及到個體用戶的行為與興趣,蘊含著巨大的商業(yè)價值(下文稱作“第二類數(shù)據(jù)”)——如此前在在線廣告數(shù)據(jù)交易中提及的用戶標簽數(shù)據(jù)。這類數(shù)據(jù)交易前應把PII信息(個人身份可辨識信息)去除,但用于找出這個用戶的虛擬用戶身份標識是不能被去除的,否則哪怕數(shù)據(jù)再有內(nèi)涵,無法定位到用戶并轉(zhuǎn)變?yōu)闋I銷與洞察,這類數(shù)據(jù)都是難有有武之地的,但保留用戶身份標識又涉及到了隱私保護的問題。正是由于對于隱私保護的憂心忡忡,第二類數(shù)據(jù)的交易難度與成本都非常的高,而如何促成這類交易,則是數(shù)據(jù)交易市場的核心任務。
無論是個人征信、在線廣告定向、大數(shù)據(jù)精準營銷都與能細分到個人的第二類數(shù)據(jù)密切相關(guān),同時在線廣告業(yè)的實踐證明,這類數(shù)據(jù)雖然涉及隱私問題,但并不是不可交易的,需要的是一套隱私保護與管理機制。同時本文認為,第二類數(shù)據(jù)交易也將會是未來數(shù)據(jù)交易的核心內(nèi)容,而交易過程的隱私保護與管理機制同時將會是數(shù)據(jù)交易市場的核心競爭力。
另外,關(guān)于第二類數(shù)據(jù)交易的隱私保護本文有一個核心觀點:最佳的隱私保護方法不是試圖隔離用戶的知曉,而是讓用戶這個數(shù)據(jù)當事人能參與其中,甚至獲取部分數(shù)據(jù)交易的收益。例如,對于允許自身數(shù)據(jù)被制作為興趣標簽的用戶,在精準推薦中能獲得商家更好的折扣。
問題二:誰參加數(shù)據(jù)交易?
現(xiàn)在業(yè)內(nèi)每當在新掛牌的數(shù)據(jù)交易所會員名單中,發(fā)現(xiàn)赫赫有名的互聯(lián)網(wǎng)巨頭時都會興奮莫名,仿佛數(shù)據(jù)交易即將會因為這些數(shù)據(jù)資產(chǎn)寡頭的到來而即將被激活一樣。但數(shù)據(jù)交易市場作為一個雙邊平臺,其興起的根本要素在于具備足夠數(shù)量的活躍供給和需求方,除了巨頭以外,我們還要關(guān)心一下長尾數(shù)據(jù)。
所謂的長尾數(shù)據(jù),就是散落在不同所有者上的零散數(shù)據(jù),每個所有者擁有的數(shù)據(jù)量不會特別大,因此不足以激勵他們想辦法變現(xiàn)數(shù)據(jù)。而數(shù)據(jù)交易中心,則作為一個平臺能夠提供便捷的數(shù)據(jù)變現(xiàn)能力,需要吸引到長尾數(shù)據(jù)供給方的到來,并提供平臺能力幫助中小數(shù)據(jù)供給方變現(xiàn)手中的數(shù)據(jù)。
大數(shù)據(jù)交易的價值,還應該體現(xiàn)在交易的多樣性上,如何吸引長尾數(shù)據(jù)的到來,是數(shù)據(jù)交易市場的另外一個關(guān)鍵任務。
問題三:如何對數(shù)據(jù)進行定價?
本問題實際上是希望回答,數(shù)據(jù)交易中如何降低討價還價的高昂成本。即針對數(shù)據(jù),我們應該如何去定價,才能最小化交易成本,而對于數(shù)據(jù)定價,第一類數(shù)據(jù)和第二類數(shù)據(jù)是有較大區(qū)別的。
對于第一類數(shù)據(jù)(不涉及用戶隱私的統(tǒng)計或科研數(shù)據(jù)),其定價相對可以比較簡單,大部分情況下,采取供給方定價的形式就足夠了。一方面是因為第一類數(shù)據(jù)由于不涉及個人,其價值相對性的波動不會太厲害,無需采用更復雜的定價模式,另外采取供給方定價,能將數(shù)據(jù)產(chǎn)品運營權(quán)保留在供給方,使其能夠以各種如限免、促銷等方式運營數(shù)據(jù),使得有價值的數(shù)據(jù)能夠普惠更多需求方。
關(guān)于這個本文自創(chuàng)的“數(shù)據(jù)普惠”說法,這里想稍微延伸一點:第一類數(shù)據(jù)實際上是屬于基礎(chǔ)類數(shù)據(jù),帶有“準知識”的特征,如氣象變化數(shù)據(jù)、城市交通數(shù)據(jù)、語料數(shù)據(jù)等。只要不涉密,讓盡可能多的需求方擁有它們實際才是社會價值最大化的做法,過中道理就如知識不應該被壟斷一樣顯而易見。
對于第二類數(shù)據(jù)(個人特征行為數(shù)據(jù)),由于能赤裸裸地用于如個人征信、營銷等商業(yè)用途,其價值相對性的波動會非常大,大到甚至連供給方都不能準確評估其市場價值的程度。因此,第二類數(shù)據(jù)比較理想的定價方式是需求方定價。關(guān)于數(shù)據(jù)的需求方定價,在本文第一部分有簡單涉及,而上一章節(jié)提及的在線廣告數(shù)據(jù)平臺Bluekai,其數(shù)據(jù)定價方式實際上也是采取數(shù)據(jù)競拍即需求方定價的方式,價高者得,同時控制數(shù)據(jù)的供給數(shù)量,確保一份有價值的數(shù)據(jù)僅被一到兩家客戶所有。
個人特征及行為數(shù)據(jù)的鮮明特點是超乎想象的細分程度,數(shù)據(jù)需求方僅會對其中一小部分數(shù)據(jù)感興趣,例如上海的淘寶賣家只關(guān)心江浙一帶的用戶數(shù)據(jù),使得供給方對千千萬萬的細分數(shù)據(jù)做定價變成了幾乎不可能的任務。正如當初Google推出搜索引擎關(guān)鍵字廣告時,根本不可能對幾百上千萬的各種關(guān)鍵字逐一定價出售,最有效的方式就是采取需求方定價,即關(guān)鍵字競價形式,綜合出價最高的廣告主將贏得對應廣告位的展示機會。
當然,為實現(xiàn)第二類數(shù)據(jù)交易的需求方定價,數(shù)據(jù)交易市場的規(guī)則設(shè)計是核心問題,另外還離不開的是數(shù)據(jù)產(chǎn)品化。在交易之前, 數(shù)據(jù)知識發(fā)現(xiàn)KDD(Knowledge Discovery in Data)應該由數(shù)據(jù)交易市場完成,即數(shù)據(jù)已經(jīng)由數(shù)據(jù)交易市場以云計算的形式經(jīng)過充分的處理與挖掘,由需求方直接競價購買使用。
第四部分 對于數(shù)據(jù)交易市場的建議
目前得益于大數(shù)據(jù)這一迅猛的風口,在不同省市的政府與商界的推動下,各地數(shù)據(jù)交易中心如雨后春筍般成立。鑒于政策紅利和對后續(xù)牌照發(fā)放的不確定性,先搭臺后唱戲的策略實屬無可厚非,但正如本文一直強調(diào),數(shù)據(jù)交易市場的核心定位是降低交易成本,無法具備這一能力的數(shù)據(jù)交易中心在長期上是注定要被市場淘汰的。
與掛牌相比,數(shù)據(jù)交易中心的運營是更為艱難的任務,世界上也許沒有第二種商品的交易會像數(shù)據(jù)那樣具備想象力和創(chuàng)造性了,對于數(shù)據(jù)交易中心的短期發(fā)展,本文有幾個不太成熟的參考建議:
1.數(shù)據(jù)交易中心首先應該圍繞不涉及個人隱私的第一類數(shù)據(jù)(即統(tǒng)計與科研數(shù)據(jù))入手,著力促進這些數(shù)據(jù)的交易;
2.數(shù)據(jù)交易中心需要具備專業(yè)的數(shù)據(jù)應用團隊,幫助對接數(shù)據(jù)產(chǎn)品化問題。這個專業(yè)的團隊在始創(chuàng)期非常關(guān)鍵,屬于交易中的“催化劑”,以化解交易市場雖然發(fā)展了大量會員但交易量極低的尷尬;
3.設(shè)計良好的制度框架,將數(shù)據(jù)供給方的角色從“出售者”轉(zhuǎn)變?yōu)?ldquo;數(shù)據(jù)長期運營者”,這點上一章節(jié)已詳細提及,活躍是交易市場發(fā)展的根本;
4.試錯第二類數(shù)據(jù)的交易,也就是涉及到個人用戶,存在一定隱私保護問題的用戶特征與行為數(shù)據(jù)。
對于數(shù)據(jù)交易中心的長期發(fā)展,在于找到一套成熟的方案,能夠公平合理地交易蘊含著巨大商業(yè)價值的第二類數(shù)據(jù),這是對于數(shù)據(jù)交易中心的終極考驗,也異常的困難,但倘若能做到,則未來的數(shù)據(jù)生活或許因此而改變。
第五部分 可穿戴設(shè)備與未來的數(shù)據(jù)生活
適逢今年雙十一,小米推出了全新的99元的新一代小米手環(huán)。可穿戴設(shè)備已經(jīng)改變了我們每一天的生活,小小的手環(huán)記錄著我們每一天的生物特征與運動軌跡,而其中最為津津樂道的,是每一天晚上查看自己當天行走的步數(shù),并在微信上與朋友們比拼。而這件事情的本質(zhì),是設(shè)備為我們提供測量服務的同時,在內(nèi)部產(chǎn)生了相應的數(shù)據(jù),而為了滿足社交需求,我們選擇將數(shù)據(jù)授權(quán)給微信,并在約法三章的情形下變成了微信運動應用的輸入。
其實深入思考,其他個人數(shù)據(jù)實際與此有驚人的相似,比如運營商為我們提供通信服務的同時,產(chǎn)生了大量個人的通訊行為數(shù)據(jù)。這些數(shù)據(jù)作為服務的副產(chǎn)物,理應被放在陽光下面,只有在我們授意的情況下,才能被用于其他用途。
當然,這兩者還有一個微妙的差別:手環(huán)作為一個私有物品,理應為我們毫無保留地服務;而如運營商等其他服務提供方,在為我們提供服務時,各類行為數(shù)據(jù)是屬于可記可不記的數(shù)據(jù),而運營商等花費了巨大投入,建設(shè)了企業(yè)級大型數(shù)據(jù)倉庫從而能夠記下這些數(shù)據(jù)。從倫理上說,對于用戶而言這些數(shù)據(jù)不應該是白吃的午餐,但數(shù)據(jù)確實與用戶隱私密不可分,服務提供方單方面變賣數(shù)據(jù)同樣不合適,這就是數(shù)據(jù)交易的兩難問題。
這里總存在一個雙贏的方法,想象一下,未來的數(shù)據(jù)生活也許是這樣的:
新的一天開始了,我打開了手機,收到了為我服務的電信運營商發(fā)過來的最新通信報告,里面詳細總結(jié)了我的通訊行為,并為我的套餐用量提出了建議,并表示我在他們公司的私人數(shù)據(jù)賬戶又新增了5點成長值。同時不忘推薦幾個周末度假的美妙地點,理由是根據(jù)我過去幾天上網(wǎng)興趣點而推薦的,由于我允許了這家運營商使用我私人數(shù)據(jù)賬戶的特定信息,在我感興趣的旅游、餐飲、圖書等領(lǐng)域用于個性化推薦,因此我擁有了這幾個度假景點的9折優(yōu)惠,同時運營商還免去了我的一部分月租。
另外在我的供電公司私人數(shù)據(jù)賬戶里面,我能查詢到歷史上任何一天的用電情況,并能獲取到一些節(jié)能建議。當然我家里電器的使用數(shù)據(jù)能更好幫助電器生產(chǎn)商設(shè)計它們的產(chǎn)品,我同樣把這些數(shù)據(jù)授權(quán)出去了,雖然偶爾我會收到它們一些新電器的略微煩人的推廣,但誰叫這個授權(quán)每月能給我?guī)黼娰M的減免,我還是樂意的。除此之外,我還有電商網(wǎng)站、航空公司那邊的私人數(shù)據(jù)賬戶,它們會為我妥善保管數(shù)據(jù)并供我使用,你問我放心不?當然,因為我知道世界數(shù)據(jù)共享及使用公約會保護我,使得他們只能在框架之內(nèi)使用我的數(shù)據(jù)。
各位對于上述烏托邦式的場景不妨僅權(quán)作感受,但有一點是可以肯定的是,在未來數(shù)據(jù)的交易與應用中,用戶應該深度參與其中。未來數(shù)據(jù)將會成為一項寶貴的資產(chǎn),而用戶作為數(shù)據(jù)的第一方當事人,對于自己的數(shù)據(jù)享有權(quán)利是毋庸置疑的,未來需要有法律法規(guī),甚至全球性的公約去清晰界定個人數(shù)據(jù)的范疇與權(quán)利,將所有數(shù)據(jù)放在陽光之中,用戶擁有對于自身數(shù)據(jù)的決定權(quán)和分配權(quán),使得整個大數(shù)據(jù)經(jīng)濟能在嚴格的規(guī)則框架下運行,甚至催生“數(shù)據(jù)銀行”這一特殊的機構(gòu)。
從用戶視角出發(fā),用戶擁有數(shù)據(jù)權(quán)利-授權(quán)第三方使用或不使用-獲取部分收益也許是未來大規(guī)模數(shù)據(jù)交易與應用的主流模式。陽光下的數(shù)據(jù)授權(quán)是必要環(huán)節(jié),關(guān)于授權(quán)大概可以有兩種模式,即“Opt-in”與“Opt-out”模式。“Opt-in”是主動授權(quán),如一些國外的一些車險公司會在用戶授權(quán)下,在他們汽車里安裝一個定位模塊收集行駛數(shù)據(jù),并根據(jù)車主的駕駛習慣開展車險費用個性化定價,擁有良好駕駛習慣的車主能獲得比較大的折扣優(yōu)惠。而“Opt-out”模式則是只有在用戶明確反對的情況下才取消數(shù)據(jù)應用,例如上文介紹的在線廣告基于用戶個人興趣的廣告,相關(guān)用戶個人標簽會被默認使用,除非用戶提出Opt-out。兩種模式談不上優(yōu)劣好壞,跟多需要根據(jù)實際的數(shù)據(jù)特性而選擇,但比此更重要的,是相應的頂層法規(guī)與行為框架的設(shè)計與監(jiān)管。
未來大規(guī)模的數(shù)據(jù)交互與協(xié)作將成為一種全新的生產(chǎn)力,甚至是一個又一次改變游戲規(guī)則的“奇點”。有一天,也許會出現(xiàn)“數(shù)據(jù)銀行”這種特殊的機構(gòu),我們一生的數(shù)據(jù)都可以存放在其中,按照我們的授意得到妥善的應用,并為我們創(chuàng)造收入。而這些收入的出現(xiàn),都是因為數(shù)據(jù)能在更為廣泛的場景中交易與應用,被轉(zhuǎn)變?yōu)榫薮蟮膬r值。