以下為現場速記。
![](https://hfnxjk.com/uploadfile/2018/0525/20180525110007517.jpg)
中國移動集團 大數據總架構師 段云峰
段云峰:很高興有機會跟大家做交流,首先感謝范總提供這么一個機會,讓業界的同仁能聚在一起,能夠就很多內容充分的展開,這也是很難得的機會。今天講的內容可能比較燒腦,講完很多內容之后,今天我跟大家講的題目可能是站在未來的20年,很多內容也是從我們的實踐過程中發現的一些問題提出的,我們叫數聯網,這是第一個角度。
補充一下自我介紹,本人應該算是國內最早從事計算機的一撥人,我是從1984年從蘋果2開始接觸計算機的,在座有比我早的舉手,真有,very good,真是頭一回碰到。過去30年里一直沒有離開過計算機,從2000年前后開始從事數字倉庫,當年叫數字倉庫,后來做大數據。整個一路走來,這個數據倉庫現在在電信領域也是算是最大的,是500個PD。累計前后17年時間投了140多億,所以在國內應該說是買到了最難得的教訓,應該說大家知道的數據倉庫領域和大數據領域的各種工具,我們都曾經買過、都曾經用過,所以大家有什么疑問都可以找我。這里有很多內容,所以今天也跟大家做一個分享。
這是我出過的幾本書,今天跟大家分享數聯網的內容是在這本書,2015年就出了。當時我在這本書里面提出了數聯網的雛形或者概念,今天跟大家分享數聯網的內容,因為影響會很深遠。這本書是《大數據的互聯網思維》,實際上是講方法論的,今天做大數據的很多,到底這個系統怎么建、怎么服務,在學術圈沒有方法論,所以把互聯網和大數據的思維結合起來應該是第一個。
這是各種規范和文檔,我們做了大量的資料整理設計工作,所以應該說是花了大量的精力。這是插了幾頁,介紹一下中國移動的一些情況,之后再進入整體。這是最早的情況,2010年的時候是從數字倉庫開始,大家看最早是數字倉庫,怎么建集市,在上面提供報表。2015年的時候我們定了一個大數據的架構,因為中國移動的特點是傳統數據倉庫也買了很多,各種倉庫都買了。后來我們想用MPP等這樣的一些數據庫,來替代傳統的數據倉庫,因為傳統的數據倉庫是在小型機上,成本比較高。這個系統相對來說比較復雜,而且我們花了大量時間做數據質量的工作。
昨天鄧總也說,他們在中石油花了2個億做數字質量的梳理,我花了2年的時間去整理數據質量,所以這個過程是所有人都對比不過去的。這是我們大致的一個歷程,這是大概從2010年前后開始標的,每一年我們都有一些工程項目,做的事情都很明確,我們一步一步積累到現在大概有17年的內容,這個在國內應該也是比較少見的。這是我們系統的情況,大家可以看一下,在運營商里系統比較復雜,今天提的很多內容也是我們的現實場景提出來的,這些給大家看到的只是大家感受到的,我們網絡管理、業務系統等等,實際上累計加起來IT系統大概有2000多個,每個IT系統都有很多數據,這種龐雜的程度可能國內沒有人比我們更復雜的。這么大的量你怎么去處理,這可能都是我們面臨的一些問題。
這是一個簡單的量,大家對比一下就知道了,在運營商里面一天光地域的,我們說的地域是計費領域,收入數據是96億條,這只是一個省而已,大概是7個TB數據量。這些內容我們可以感受到,運營商的數據量是很龐大的,所以這個量可能也會對我們的各種技術平臺的處理方方面面帶來很多挑戰。實際上我們很多問題像IBM在國際上都沒有碰到過,他沒有碰到過這么大的量,一系列的問題都需要我們探索怎么解決。
這是我們在X86的15000臺,還有小型機等等,這個量比較大,就不給大家展開了。這是我們提供的一些相關的應用,這些應用里面大家可以看100多個分析模型,這100多個分析模型是全國通用的,一個省里面大概上千個個性化的應用。所以應該說大家能看到的應用我們都做,包括產品分析、營銷分析、內部管理分析、網絡怎么結合等等。在人工智能方面,我們也做了一兩年的探索,今年初范總的內容里面,我給大家講的是人工智能,所以這次給大家講的時候稍微結合一下大數據,所以講數聯網。這些內容都是具體實際做過的,做的過程中反正也有很多的經驗和教訓。
這是我們現在對外提供的大概的幾個大數據層面的,這是我們叫DaaS層,一般云計算是IaaS層,上面是PaaS和SaaS。DaaS主要是提供數據,現在中國移動的總數已經很龐大了。我們這些數據的內容怎么對外提供,現在各方都對我們有數據的需求,但是有時候央企對數據比較敏感,不太對外提供,這是我們體制的制約。
剛才主要是插播了一下中國移動的情況,給大家做一下介紹,下面進入主題數聯網階段。數聯網范圍很大,以BAT為主,我們產生了很多平民英雄,創造了互聯網的奇跡。未來數聯網產生的遠不止目前這樣的情況。在講之前我做一個小調研,各位手里誰有10個TB以上數據量的舉一下手,不多。第二個,用過Hadoop的舉手,這么多。第三個,你讀過Python或者寫過Python的舉手。我做一下調研是跟大家分享一下,看一下大家的情況,我主要的主題思想是別再錯過這波新機會了。
為什么會提數聯網?核心變化是什么?通俗說話是從IT時代進入DT時代,我們這次的會議是CIO,實際上未來最大的影響可能是產生在DT上、是產生在數據上。我們形象的說法,IT面對更多的是流程,面向流程,通俗的說法叫流程僵化、固化再優化,這是我們一個傳統的思路。但是在DT時代不是這種玩法,DT時代更多的是面向數據、面向分析,提供的是智慧的角色。而且最重要的一點,各位CIO們,未來你們將不再是配角,你們有可能把CEO干掉,你們來當CEO,知道嗎?我希望這個有掌聲。
為什么給大家說這個?我給大家舉個例子,我們現在正在用人工智能去做數據分析,分析完了以后,我們可以發現人工智能比人做營銷更靠譜,所以未來我們可能的場景是什么?首先替換到營銷,理論上不需要人來營銷,用AI營銷,來決定給誰賣什么東西。因為人的經驗大概是十幾個維度,AI起碼上百個維度,這個已經做到了,首先是替換掉人做營銷。未來所有的管理、所有的內容都將基于數據、將基于人工智能,所以未來各位權利掌握在你們手上,你來決定公司怎么走、應該賣什么、怎么賣、怎么生產等等等等。所以你會成為未來企業的核心競爭力,而不是現在在IT時代我們只是一個配角。為什么說這個?因為是我的切身感受,我干了30年的IT,一直從配角終于到今天往舞臺的正中央在走,這是我的切身感受,所以拿來跟大家分享。
在DT時代我們更多提到的是大數據,貴州的同志都知道大數據,但是大數據時代面臨著第二個重要的問題,我們的數據是單點、割裂的大數據,我們現在提出的都是單點的割裂的數據。基于我們中國移動內部的需求,我們提出了數聯網的概念,這是我們今天跟大家分享的內容,數聯網為什么會冒出來、它的基礎、技術架構、管理機構以及會帶來的商業機會。
從個人的案例說起,舉個例子,如果各位做過裝修可能都有切身的感受,一會兒安裝櫥柜的人到你家量一下,一會兒衛生間鋪地磚的,只要你家裝修家里就要不斷留人,干活的各種人會來你家測量數據,這是我們面臨的真實情況。還有一種是企業之間怎么做數據交換,比如說中國移動的可能就涉及到和省里做交互,怎么交互、怎么提供接口。傳統都是一對一的,現在能接的都一對一接口,這是我們目前的情況。但是將來如果在整個社會上全是用大數據的時候,我們會面臨一個什么樣的問題,我要跟所有人談一對一的接口,比如說我和昨天春秋航空的邱總談接口、我和紅芯談接口、我和各種想用中國移動數據的人談接口,這個就很像當年單點PC機的過程,并不是解決一對一連接的問題,而是普遍連接的問題。這是互聯網。
同樣的站在大數據的角度,不同企業之間在交換數據的時候也面臨同樣的問題,還是像傳統單機時代一對一的去連接、談數據接口嗎?還是提供一個統一的環境和接口,大家一起按照這個去進行交互呢?這就是我們數聯網提出的主要的背景。中國移動在這個過程中也是面臨這個問題,就是我怎么去對外提供一個大家能接受的數據的情況等等內容,這是我們要面臨的一些問題。對大家而言,
大家可能會問,這個數聯網可能離我很遠,但是大家可以以終為始,大家在做大數據系統的時候就可以考慮它的標準化等等方面的問題,這個對我們國家將意義深遠。
這是今天講的一些內容,第一章是概述,介紹一下什么是數聯網。這是數聯網的演進過程,核心問題是面向數據的連接,解決數據的直接互聯問題。因為傳統的模式里面,我們的互聯網是站在信息流的角度,并不是站在數據的交流,所以它是面向連接的,這個角度是不一樣的。我們站在大數據角度,這是我們看的一個點,互聯網解決了計算機的連接問題,我們希望未來的數聯網解決數據的連接問題,這樣會帶來一個什么樣的場景,我后來會給大家講。總結下來,過去的20年看的是互聯網,未來的20年看的是數聯網。所以今天跟大家分享一些可能會對在座各位都會有很深遠影響的內容。
舉個例子,什么叫數聯網呢?比如說張三要買一輛汽車,正常的情況他看上ABC三輛車,他會查這些車的油耗數據、賣點、價格、售后數據等等,進行數據收集,決定是否購買。我們通俗的是一個網站一個網站的收集,包括客戶的評價、產品的評價、市場的銷量、廣告的效果等等,這些維度的很多數據現在張三是拿不到的。未來在數聯網的場景里面,張三能夠直接調出A汽車的油耗的真實數據,舉個例子所有在座諸位都看上A這款車,實際的油耗是多少,我拿過來做一個平均,我就能知道這款車的油耗是多少,比工信部公布的油耗數據靠譜多了,那個不太準,你們都是實際的用戶,都是實際跑的,作為一個買家而言極其重要。因為我是理工科的博士后,我干什么東西一般都愿意用數據分析,我不看廣告,廣告對我沒有什么吸引力,我更關注的是數據,這是我們理工男的特點。
拿到這些數據之后,對我判斷買A車還是B車是重要的影響,但是目前我們拿不到這些數據。這是我們目前能看到的,包括我們現在的搜索也面臨這個問題,比如說百度或者谷歌,現在面臨的問題是我收集到的是信息而不是數據,都是一個一個網頁,我要自己從這個網頁里面摘、讀,抽出A車的油耗數據。現在還有大量的非結構化數據,站在人工智能的角度來說,未來可能很多數據是非結構化數據。在做非結構化數據的時候,我們發現我們收集的數據很少。非結構化數據你怎么去收集它,怎么建立檢索的機制等等一系列的問題,我們核心的問題是要流通的數據帶來價值。我們都知道,商品商業交換,這個杯子放在我手里某種意義上并不值錢,只有我把這個杯子賣給你的時候才能變現、才能賺錢。
數聯網的出發點就是打開彼此的數據庫,比如說中國移動的數據庫、春秋航空的數據庫、在座各位的數據庫,我們彼此打開數據,而且不需要你給我解釋,我就直接能讀懂你的數據,這是我站在數聯網的角度來說的一個出發點。所以大家能理解這些事背后能帶來的一些意義,戰略性的意義。我一說大家就能理解,單點數據的價值維度是有限的,舉個例子,中國移動只能看到中國移動的數據,我站在銀行的角度能看到金融的數據,我站在淘寶的數據能看到網絡購物的數據,這么多維度混合起來意義重大、這么多數據混合起來意義才重大。數聯網我們強調的是節點之間的數據互聯,怎么提供泛集群的處理能力。
這里大家可能會問一個問題,共享經濟下我們的數據能不能共享?很多人是搖頭的,因為現在最大的問題是數據隱私,后面我會單獨談。這里先給大家舉個例子,這個小伙子把自己三個月的隱私數據7個GB在網上公開售賣,賣了1000美金,這是幾年前的案例,說明背后有很大的商業價值在里面。可能很多人聽不明白,但是我希望幾年以后大家都能理解我今天說的事,這就意味著我可以創造新的商業模式,后面我會單獨講。
這是我們看到的數聯網的一些關鍵的內容,一個是要解決數據互聯的問題,還有架構層面、應用層面、設備管理層面,還有一個是隱私保護的問題,哪些數據能夠共享,哪些數據不能共享等等。數聯網最大的變化可能是從免費到盈利,這是站在客戶角度來說可能會出現這個節點,互聯網時代我們可以免費使用各種東西,在數聯網時代你可以賣7你的各種數據,這個可能更有想象空間。這是我們比較的一個大致的架構、概念,數聯網我們每個大數據的節點,比如說中國移動的節點、淘寶的節點、工商銀行的節點都是一個數聯網的節點。我們通過數聯網能夠進行彼此的數據交互,這個過程中我們要解決協議的問題、我們要解決計算的問題,這個計算的問題實際上也是我們站在移動的角度內部真實面對的問題。
舉個例子,西藏服務器不夠多,突然出現一個大的計算的需求,怎么辦?我能不能把他大的計算需求放給廣東來做,廣東的設備足夠多,把結果反饋回去就行了,當然這是現在正在做的一個方向。這是我們看到的一些大致的角度,右邊這邊是大致的層次關系。因為我的博士是在北京郵電大學畢業的,所以我們比較擅長做通訊,我們可以這樣做。今天跟大家分享的很多內容都不成熟,都處于萌芽狀態,數聯網剛剛開始提出,而且現在在有些機構里面剛剛開始提這個概念。這個大家可以看到,數聯網將來建立在互聯網的基礎之上,就能帶來很多想象的空間。
這個我們感受到數聯網的意義,第一帶動新的產業機遇,有很多,為什么我剛才前面幾張PPT說不能錯過這波機會,這波機會遠超過互聯網,會有很多新的產業機會。第二是有很多新的商業模式,新的商業模式會重新產生,舉個例子征信,我們傳統的商業模式都是我把東西賣給你、你給我錢,都是這樣的套路。淘寶解決的是什么?彼此不信任,我怕我把貨給你你不給我錢,我擔心的是我給你錢你不給我貨,淘寶解決的第一層面的問題,未來在征信層面我們所有的人都將是透明的,明白我說的意思嗎?實際上你干的所有事情都是透明的,未來在數聯網時代理論上騙子沒有存在的可能,現在我們的手機支付改變了我們幾年前的一個行業,大家知道是什么行業嗎?小偷基本沒了,為什么?因為你不帶現金了,你不帶現金以后這幫小偷偷什么?偷你的手機麻煩,第一解鎖不了、第二賣不了錢,幾千年的小偷在今天很難生存,這是一個很大的變化
未來有了數聯網、有了大數據以后,可能的結果會是什么?騙子也將會不再存在,因為你沒法騙別人。馬云開玩笑說,現在男孩和女孩見面決定處朋友的時候,交換一下螞蟻信用分,看對方是否靠譜。富士康的郭臺銘說要通過大數據找女婿,因為騙不了人家。這種征信會改變我們的社會,我們中國人幾千年前學《論語、《孔孟》就是學道德的標準,以前我們是靠榜樣的模式,現在有了大數據、數聯網以后是倒逼你不得不做好人,否則你一輩子將背著這件事情。
我給大家舉個例子,我有一個朋友在澳大利亞干了一件事,喝酒開車、酒后駕駛被警察抓到。因為證據確鑿沒辦法,他當時特意玩了警察,這件事對我有多大影響,當時那個白人警察說沒有什么影響。這個哥們只能認罪,最后的結果他因為這次酒駕有一次犯罪記錄,在國外叫犯罪記錄,所以不能移民澳大利亞,最后又回來了。這就是一個征信最簡單的案例,這就可能會改變我們未來的商業模式,為什么?大家知道溫州幫為什么炒房子彼此之間不用打借條,給你100萬你到時候給我還錢就行了,為什么?建立在信用基礎之上,實際上未來的商業也會這樣做。比如我跟范總以前認識與否都可以,我們兩個彼此都有自己的所有征信數據,我對范總很了解、范總也對我很了解,我們可以直接做生意,很多商業模式都將改變。
而且大數據會是一個倍增器,從我們現在正在做的事情看,人工智能的影響應該是很顛覆性的。大家都是做IT的,我做IT做了30年,很多新技術我開始是將信將疑,但是現在看速度越來越快,而且效果越來越好。雖然有炒作成分,但是這些新技術漸漸炒成真的,而且大家也看到它的效果和影響。所以在數聯網時代,商業更加透明,商業模式將發生很多顛覆性的變化。我今天給大家講的可能都是很燒腦的內容。這是第一個數聯網的一些概念。
下面是數聯網的一些新的涉及到的技術層面,要做哪些方面的研究。數聯網方面我們看一個是促進數數相連,未來數據不是問題,為什么?物聯網的連接按照目前的規劃大概在2020年全世界500億的連接數,中國100億的連接數中國移動目前才算9億用戶,才算9億連接數,就有500個PB的數據了。如果是500億的連接數會是多大的量,未來數據不是問題,未來數據的打通是問題,這是我們必然面臨的情況。所以大家可能現在還面臨數據怎么收集整理的問題,將來這些都不會是主要的問題。我們從信息的連接到數據的連接,這可能是我們面臨的一個主要的點。
這個參照了TCPIP等等協議,它是按層次劃分的。右邊是我們站在一個大數據節點的分層,分層完了之后可以在每一層構建自己的通信模塊,來解決每一層的通信問題,最終的想象結果是比如說西藏要做一個計算,我在廣東能夠把自己的計算CPU甚至CPO資源幫西藏算出來,最終把結果反饋給西藏,可能產生這樣的一個場景。未來各位也一樣,你有數據計算不用自己計算,放到中國移動我幫你算。這是云計算的模式,但是云計算的特點是你首先要把數據挪到云中心,未來的數聯網不用,很多顛覆性變化都會產生。但是有一點核心的基本數據標準,這是我們必須要做的,物理模型、邏輯模型、概念模型還是要做的,在大數據領域我們一樣要解決數據的標準化問題。這個我們苦衷很深,大家開始做的時候都關心算法是不是好、是不是優秀,我的負責人告訴大家,17年過后機器學習算法不超過20種,大家用到的都是那些聚類分類的東西,17年過去我在機器學習方面沒有見到什么新的算法。但是我們在機器學習面對的問題是數據質量對模型的影響,遠超過算法對你的影響。這是我向大家分享的一些經驗,所以我們的數據標準基礎活永遠無法避免。
數據傳輸的標準化,我們怎么做,包括一些協議。昨天紅芯的陳總給大家講了瀏覽器,在互聯網我們可能會產生新的協議,很多東西都會產生。還有新的傳輸標準,還有新的應用層的解讀數據,我們一定要想辦法在數據上自己攜帶語義,這個數據到底說的是什么,這個車的參數到底是什么,我怎么知道這個車的參數是油耗,而且單位是升、是百公里油耗,這些語義信息一定要在傳輸過程中自己攜帶。在數聯網不可能像現在一樣,我一直和邱總談這個數據什么意思、那個數據什么意思,這個太麻煩了,以后是數據自己攜帶語義。
這是數據交換的標準、數據接口的標準等等,所以大家能感受到里面的一些機會。舉個例子SQL,我們原來在數據倉庫領域、在機器學習領域寫了很多機器學習的程序,這個大大的降低了我們我們在AI編程方面的難度。在我這個圈子里面有一個真實的案例,我的一個朋友的孩子2歲,2歲的孩子正常應該是學英語,但是他讓他的孩子學編程,因為英語已經用處不大了。如果我不會英語,我到美國拿著翻譯機,我這邊說中文,這個東西翻譯成英語,那邊說英文這個東西翻譯成中文,滿足我們日常的生活需要是沒問題的。我們2歲的孩子還需要學英語嗎?未來真正決定他們的工作是程序思維,人工智能這些東西都將顛覆。人工智能未來會顛覆的金融領域80%都會被顛覆掉。
昨天陳總講到帝國理工,帝國理工在英國是僅次于牛津、劍橋的學校,都是屬于前三的,這種學金融的都找不到工作,大家就知道。因為在華爾街高盛600多個黃馬甲就是賣股票的交易員,大家猜猜現在剩幾個?剩了兩個,從600多個到剩下2個,全部被AI替代,又換了200多個搞IT的、搞AI算法的。所以我有時候開玩笑,未來對我們的顛覆遠超過我們現在的想象,很多人不一定意識到。為什么要提這些編程的語言,這是很麻煩的。
數聯網訪問終端的標準化,未來的終端也不是這樣的,我們現在的手機在5G之后可能都會改變,今年兩會已經明確2020年中國要上5G。5G最大的特點是加AI,AI的算法就是大數據,沒有大數據就沒有AI。數聯網解決了數據互聯,解決了AI分析能力,這是我們看到的。在終端領域能標準化到什么程度,有很多想象空間,甚至是穿戴式的、我的胳膊、我的手機,可能是投影型的,不一定是現在這樣的手機。我們在這個領域上做了一些研究,它真正的技術架構我們要解決一些關鍵的技術難題,包括一些基礎元器件。
在數聯網里面要解決數據收集和整理,我有時候跟大家講,各位同學,你們現在看到的世界更多看到的是實物世界。我干大數據可能是職業病,我看到的是數據世界,所有的實物是為了產生數據而生的。不知道有多少人聽懂我這句話?明白我的意思嗎?實際上這個世界各位看到的是實體世界,但是另外一個世界是數據世界,實體會欺騙你,數據不會欺騙你。將來整個數據就打通流通起來,我就知道此時此刻在會場上有多少人等等的情況都能判斷出來。
還有七層架構,七層架構是基于原來的七層鏈路,但是七層鏈路不一樣的是我們站在大數據的角度,重新闡釋我們每一層要做怎樣的數據互通。我的最終目標是解決數據互通、計算互通、甚至將來AI的互通、人工智能能力的互通等等方面,這是我們思考的一些角度和方向。這是架構。
還有一個表述,這種表述剛才說了一定是自帶語義的表述。現在是超文本,未來是“超數據”的概念,這個超數據有自己的協議、有自己的傳輸語言甚至是自帶語義來解釋自己的數據等等。未來的數據尋址是什么?我們現在的網頁是基于UI,未來大數據數聯網的尋址不一定是這個,可能是基于超數據的定義它的文本內容。這個是我們在內部做的一些嘗試,這些嘗試還只是起步,不同節點之間怎么知道我的數據在哪兒,我說的不同節點之間比如說跨省的,未來可以跨企業的。比如說我和不同的金融機構、航空公司等等都可以是這樣的,他能知道我的數據在哪兒,直接暴露出去,直接知道我的數據內容等等信息。
這是我們的數據交換對于語義的表述,未來我們數據的表述是自帶語義的,大概我就可以知道傳過來的數據是什么意思。包括數據的瀏覽器,昨天紅芯陳總講的是IE瀏覽器,未來基于數聯網到底應該怎么樣展現數據,你明白我的意思嗎?因為我很早之前就接觸了瀏覽器,未來的數聯網將是什么樣的呢?巨大的想象空間。這是跟大家分享的,未來我們的形象說法,將不再是網站,而是數站,而且每一頁也不叫網頁,而叫數頁。這是我們未來的想象空間,都很巨大。
這是我們做的操作系統,可能每個節點都是面向大數據的互通來做OAS,這樣效率更高、速度更快。這是我們正在設計的一些內容。這是管理架構,我稍微一帶而過。因為將來的數據怎么管理質量,“內容編輯”將會升級到“數據編輯”,我幫你收集數據,而不是現在的爬蟲概念,而是爬數據庫的概念,產生之后形成一個車所有的相關數據的內容。這是數據的管理、標準的建立、數據質量怎么評估,到底這個數據是準還是不準,10個人認為這個數據誤差率超過90%,這個數據就不能用,很多內容的顛覆性變化會產生。
這個是數聯網的生態圈,未來所有的東西都將是重新洗牌,現在騰訊開始“封殺”抖音,也不能說“封殺”,可能是遏制速度,因為抖音發展速度更快。這是互聯網,更何況是數聯網呢,在數聯網層面是重新定義、重新顛覆的東西。
未來新的百度在哪里、新的谷歌在哪里,它的搜索將打開所有人的數據庫、打開所有人的數據來搜索的。未來的電商在哪里,我想賣出我的數據,比如說范總,估計范總賣大數據能賣出幾十萬沒問題,因為他的數據很值錢,透露出高端客戶的一些消費習慣,很多人愿意去買。這是我們未來能看到的場景,誰來賣這些數據,形成這些協議等等,電商在哪里。還有新的社交網絡,基于數據的社交網絡,我對這個數據不理解,你能告訴我是什么意思嗎?我對算法不理解,我對人工智能不理解,你可以告訴我怎么做人工智能嗎?未來新的社交網絡將會重新產生。
包括數據交易,目前隱私是攔在我們面前,未來只要范總能愿意共享他的數據,換一輛奔馳X300也行,可能很多人就會出來主動分享自己的數據,當然是一定維度的,有些維度太隱私的你可以屏幕。這樣的好處是什么?所有人都可以在數據上變現,這種情況下還有隱私的法律門檻嗎?你主動買我的數據,你來主動跟我簽協議,你自己賣只能賣1毛,到我這兒賣1塊,可能會有很多顛覆性的變化。互聯網給大家帶來的是免費模式,數聯網將給大家帶來的是盈利模式,還給你錢行嗎?這個有很多想象的空間。
應用的內容,包括基于數據怎么提取報告、怎么做專家診斷。舉個例子,現在AI已經能夠顛覆教育,我的孩子在北京,他們今年初三,英語口語考試是AI判卷的,因為人判卷很難客觀,AI人工智能來打分。而且現在AI教育是知識點教育,高二物理有多少知識點,讓我的孩子來做題,發現第三個知識點不太熟,做題的時候就圍繞第三個知識點。比如10個知識點,我把10個知識點都做完了,我會根據你的弱點給你出題,這是AI現在正在顛覆的,北京四中正在用AI來做教育。所以這個我們感受到,將來也一樣,未來講高二物理的可能全國一個老師、兩個老師就夠了,因為他們是全國最頂尖的東西,可能很多東西都將被顛覆。
這是在線服務。可能后面有幾個問題,稍微講一兩個。第一個是計量問題,數據到底怎么計價,原來我們看到的都是有形的東西,這個饅頭多少錢、范總今天打了多少個電話,這個要算一算。計價方式、評估標準、價值表述方式、數據交換市場的隱私等等,這里面有一系列的問題。包括這個隱私怎么規避,首先在大數據時代、在未來的數聯網時代,各位同學你覺得你還有隱私嗎?隱私沒有吧,隱私是一個奢侈品。扎克伯格為了保護自己的隱私買了這棟別墅,他怕別人在旁邊建高樓看到他的情況,他就把旁邊的都買了,這說明什么?未來維持隱私極其奢侈。中國幾千年,同學們你們有過隱私嗎?中國人有過隱私嗎?如果范總是某個省的省長,你什么意思啊?領導過去就會說什么意思,你們幾個要開什么會,中國幾千年里實際上就沒有過隱私,隱私是一個舶來品,是國外傳過來的隱私。所以中國人對隱私的關注度不如歐美,所以愿意拿隱私換方便,如果再拿隱私換錢呢?大家就沒意見了。實際上什么是隱私呢?帥哥們你的開房記錄也是對你老婆是隱私,對我們誰關心呢?我們不關心,很多東西都是相對的,這是我們看到的。
最后給大家作一個總結,數聯網可能會改變我的思維模式,人工智能會顛覆未來。人工智能目前我們看到的金融會被顛覆,教育、法律、英語,這種外語將來都沒有什么大的問題,現在最大的是方法OK了,以后是工作量的問題,只要你有足夠的工作量和足夠的數據就OK,所以人工智能會顛覆很多。我常常跟大家開玩笑,在我眼里未來只有兩個專業:AI專業和非AI專業,雖然我們傳統產業會相對慢一些,但是也一樣。你會擔心門口的野蠻人,怕干掉你,很多時候干掉柯達的、干掉相機的都不是做相機的,而是做手機的把做相機的干掉了,很多顛覆性的東西會出來。未來的商業模式都將會產生新的模式,因為我們傳統的商業模式都有一個特點,傳統是工業文明的,我們目前的思維方式、所有的商業模式都是工業文明的商業模式,沒有人想過未來的數據文明產生的數據模式會是什么樣的,大數據環境下、數聯網環境下的商業模式會是什么樣的,誰都不知道。可能結果是我只專心把我的桌子做好,為什么?我只要負責任的把全國的桌子做到質量最好的、價格最合適的,我才能活下來。我自己是不看廣告的,因為我只相信數據,未來的客戶都將理性,所有的數據都將透明,所有的生產者、生產方只要把自己的產品做到全球No.1才行,否則別人就會把你干掉,會產生很多情況,因為信息極其透明。而且未來的特點是數據極其透明,是到了性能指標的層面,不再是你的感官層面。
互聯網是美國人的世界,數聯網呢?我把這個問號拋給各位CIO們,我希望大家能夠想到。我剛才講的內容是人民郵電出版社要出版的這本書《數聯網——大數據如何互聯》,可能6月底會出版。“以終為始,規劃數據”,我相信大家還處于IT階段,第二個階段是數據收集,馬上再面臨第三個階段數據的互聯互通,有了更多的數據你對市場的把控比銷售的把控更準確,比如說桌子的市場是怎么樣的,你比銷售人員更靠譜,所以未來我們才能實現CIO去替代CEO。這是我們看到的,我最終用了這句話,實際上是馬云說的話。有些人“因為看見而相信”,還有一些人“因為相信而看見”。希望各位CIO聽完我的內容之后,“因為相信而看見”,旁邊是我的二維碼,感謝范總!