有了數(shù)據(jù)再經(jīng)過系統(tǒng)性的整理,就變成了信息,信息經(jīng)過簡潔抽象的加工,就變成了知識。
比如通過測量星球之間的相對位置和時間,就能夠得到數(shù)據(jù),通過數(shù)據(jù)就能得到星球運動的軌跡,這就是信息,通過這些信息總結(jié)出的開普勒三定律,這就是知識。
大數(shù)據(jù)有三個主要特征:體量大、多維度和完備性。智能問題的實質(zhì)則轉(zhuǎn)變?yōu)槿绾翁幚頂?shù)據(jù)的問題,機器的智能水平也會隨著數(shù)據(jù)量的增長而增長,所以智能革命的上升趨勢是不會變的。
谷歌拍攝街景的汽車,一輛汽車每天生產(chǎn)數(shù)據(jù)量大概是1TB,也就是1024GB,而一部電影按照1000MB算,也就是說一輛街景汽車每天能夠產(chǎn)出1000部電影那么大的數(shù)據(jù)量。
手機號能夠調(diào)出你的搜索習慣,通訊信息,然后你的性別、年齡、位置、文化背景這一連串的信息都會被調(diào)出來,然后根據(jù)大樣本的統(tǒng)計,你平時的關(guān)注,生活習慣等都會清楚地展現(xiàn)出來。
思維上的轉(zhuǎn)變。
我們一直是單純的機械思維,要轉(zhuǎn)變?yōu)榇髷?shù)據(jù)思維,機械思維的本質(zhì)是確定性和因果關(guān)系,如果在兩個世紀之前一個人具有機械思維,那么這個人就是頂級的精英。
機械思維被普遍接受的一個大前提是,默認這個世界的所有事物都有規(guī)律,而且世界的規(guī)律是確定的規(guī)律。
牛頓用幾個簡單的公式,比如力學三定律和萬有引力定律,就把宏觀物體的運動規(guī)律描述清楚了,而焦耳用一個公式就說清楚了能量守恒原理,麥克斯韋用幾個公式就描述清楚了電磁的原理。
而如今機械思維方式大多數(shù)時候就不太管用了,因為這個世界具有不確定性,比如測不準原理,說的就是像電子這樣的基本粒子,如果你要測量它的位置,總會有一定的誤差, 因為你測量這個動作本身就對它的位置產(chǎn)生了影響。
大數(shù)據(jù)的不確定性。
依靠因果關(guān)系認識世界的效率非常低,大數(shù)據(jù)思維則給機械思維做了完美的補充,大數(shù)據(jù)解決了不確定性的問題,「信息熵」這個概念指出,信息量和不確定性有關(guān)。
比如你看一本心理學的書籍,如果你本來就很了解心理學,那你可能很快就能看完這本書,也就是這本書提供了很少的信息量就能消除這本書的不確定性。
但如果你看一本編程的書,而你又是小白,那么可能需要一字不落看完才能理解,需要大量的信息才能消除這本書的不確定性,消除不確定性的最好辦法就是引入信息。
智能革命會讓傳統(tǒng)的產(chǎn)業(yè)加上大數(shù)據(jù)變成新產(chǎn)業(yè)。
比如弱勢球隊的崛起,首先通常是一個大老板喜歡這個球隊,然后花錢買下球隊,然后繼續(xù)砸重金購入球星和大牌教練,再通過各種廣告招攬球迷。
硅谷的一個球隊就很特殊,他們的管理層由風險投資人和數(shù)據(jù)分析師組成,他們不買大牌的球星,反而將對立特別有名的球員都賣掉,然后圍繞一個沒有名氣的球員定球隊的戰(zhàn)術(shù),這個球隊則靠著這個打法逆襲成功,成為那個賽季的冠軍。
又比如大數(shù)據(jù)在醫(yī)學上的應(yīng)用,美國一位高中生,設(shè)計了一種確定乳腺癌癌細胞位置的算法,輸入了大約760萬個病例,對癌細胞的位置預測的準確率高達96%,這比一個資深大夫要強很多,相信不久后醫(yī)生這個職業(yè)會被機器慢慢取代。
大數(shù)據(jù)帶來的麻煩。
比如奸商的精準營銷,他們會通過你的反饋記錄看出你是個好惹的人還是不好惹的人,如果你特別在乎自己的權(quán)益,買到假貨就立即維權(quán),商家就會覺得你這個人不好惹,還是給你推送真貨比較省心,而如果你對自己的權(quán)益不敏感,買到假貨也懶得退,那就總會受到給你推送的假貨。
再比如美國很多航空公司利用個人隱私發(fā)財,當航空公司發(fā)現(xiàn)某個人最近必須出行時,而這個人之前又對票價不敏感,那么航空公司就會報給比其他人高的價格,尤其是最近如果只有少數(shù)航班的情況下,他們就會坐地起價。
值得注意的是,人工智能還會將貧富差距越拉越大,唯一能做的是爭取擁抱智能時代的任何新技術(shù)和新工具,努力跟上時代的步伐,才能成為受益的那一小部分人。