1.未來大數據的一切都都關于人
…不論述
2.大數據收集困難和高風險
現在的大數據的來源,都是通過自有平臺收集用戶數據的,對于沒有平臺的企業很難有機制和渠道獲取穩定的數據來源。
有說通過法律和制度來,規范關于人的大數據使用,在這之前,唯一可行的方向是,把用戶大數據使用,做成服務的必選功能,要使用服務,必須接受隱私風險。
3.對大數據的利用方式
現在的大數據 都是由各種數據聚合出一類關于人的結論 然后拿給企業使用。
我想大數據應用還有另一類。
利用網上的大數據,告訴某類人、甚至某個人,世界發生著什么,未來要發生什么。
4.科幻大片
如果從網上下載一個專屬的虛擬人物(虛擬機器人/虛擬助理/終生人工智能伴侶)到手機。
剛開始這個角色需要你教導(配置,類似早期的語音識別控制的學習階段)才能幫你在互聯網上你做一些簡單的事情。
隨著你教導的更多更好(對你的習慣,興趣愛好,思維模式,接收度等信息的收集) 和基于大數據的挖掘和分析能力的增加,它的智力越來越高,能做一些更復雜的任務(作為入口,代表你在互聯網活動)。
直到很多年后,它的智力超過你,它能告訴你,世界發生著什么,未來要發生什么,它了解你的年齡,了解的行為習慣,了解你的經濟能力,了解你缺點,時刻為你服務,擴展你的人生,使你的人生不局限于經驗(網上有),思維(網上有),能更好的生活下去(幫你發現機會)。
類似的東西,后來才發現微軟小冰二代已經在著手做了,可能愿景和目的不一樣,但輪廓有了。
5.認知需求
我們成長的時候,家長常常說“你懂點事吧”,但如何“懂事”沒有人能教給我們,也沒有告訴我們如何去做(去閱讀書籍,去體驗生活,經歷人生);
我們畢業了,工作了,在社會上依然遇到,“各種成功學大師”,“各種領域專家”,“各種百家講壇老師”,“各種轉世神棍”,大行其道;
這一切都是因為,人有認知的需求。
6.認知培訓
基于這個需求,“認知服務”即使做不到自動,就算做人工服務,也能在現在的教育市場(學校,興趣培訓,英語培訓,等技能培訓)殺出一條出路。
7.認知模式與三分的認知世界
萊考夫(George Lakoff)在 [女人、火和危險的事物]([Women fire and dangerous things])一書中,認為理念化的認知模式(idealized cognitive models 簡稱ICMs)是結構復雜的感知整體,是對世界的整體表征,它的價值在于對輸入信息進行重組。ICMs并不客觀存在的,而是人類實踐和經驗的高度概括和總結,并且可以為以后的實踐提供參考。根據lakoff的論述,IMCs有四種:命題模式,意向圖式模式,隱喻模式和轉喻模式,它們的關系如下:
命題模式是出發點和歸宿,意象圖式模式是基礎,轉喻模式和隱喻模式是建立在命題模式和意象圖式模式上的認知事物的過程和方式,并且二者相互作用。
任一認知主體的認知世界整體可以劃分為三個部分:“信念世界”、“懷疑世界”和“無知世界”。我們用Wb表示信念世界,Wd表示懷疑世界,Wu表示無知世界。Wb、Wd、Wu是三個命題集合,他們的元素是相應的認知命題。簡單地說,信念世界是由認知主體相信的命題構成,這些命題構成認知主體的信念;懷疑世界里的所有命題是認知世界說懷疑的,認知主體認為這些命題是“假的”或“不可能的”,這些命題可稱為“疑點”;認知主體從來沒有“考慮”過的命題構成無知世界的內容,這些命題(以及它們的負命題)或者仍沒有進入認知主體的視野之中,或者雖然進入了認知主體的視野之中但認知主體不知道其意義,此時,認知主體對之既不相信又不懷疑,這些命題可稱之為“盲點”。
8.認知互聯網世界進而認知現實世界
互聯網世界一直是互聯網世界的映射,越來越多的現實世界事物在互聯網世界建立了數字化的映射,大數據的未來,就是通過這些大數據分析現實世界發生了什么,未來要發生什么,有可能到那時,數據獲取能力的不平等將取代資本,腦力,智慧的不平等。
9.包裝的產品—認知的世界+個性數據=具有類似主人人格的終生人工智能伴侶
10.通過邏輯推理認知世界–亞里士多德的三段論
亞里士多德給出的經典的“Barbara”三段論:
如果所有人(M)都是必死的(P),(大前提)
并且所有希臘人(S)都是人(M),(小前提)
那么所有希臘人(S)都是必死的(P)。(結論)
如,
所有人都是必死的。(普遍原理)
蘇格拉底是人。(特殊陳述)
蘇格拉底是必死的。[把特殊(小)代換入一般(大)]
又如,
法律規定這種行為要負法律責任,他/她做出了法律規定的這種行為,他/她要負這個法律責任”。
從上面可看出,三段論由三個部分組成:大前提、小前提和結論,它在邏輯上是從大前提和小前提得出來的。大前提是一般性的原則。小前提是一個特殊陳述。在邏輯上,結論是從應用大前提于小前提之上得到的。
與之相對的是隱喻,
草(P)會死(M).
人(S)會死(M).
人(S)是草(P).
這是另一種形式的三段論,是邏輯謬論:這種形式的三段論是邏輯上無效的,但即使是這種邏輯上無效推理,也是人工智慧的表現。
要取得認知互聯網世界的能力,可以從哲學獲得理論支持,例如從“三段論”和“三分的認知世界”,
我們利用有限個的”大前提集合[命題集合]“組成”初始的信念世界“,大前提,小前提,對應[意象圖式模式] 邏輯推導是“命題模式”,最終的結果是“命題被認為是真的,繼而加入“信念世界”。
利用隱喻[信念世界中存在的命題集合+新的命題],推導出“懷疑世界”,那么剩下的就是“無知世界”,對于這個世界,隨著現實世界的數字化程度越來越高,互聯網世界對現實世界的映射會越來越完整,“無知世界”會越來越小。
比如,
水果是可以吃的[ 信念世界存在的命題]
蘋果是水果[ 信念世界存在的命題]
蘋果是可以吃的[要認知的命題]->[加入信念世界]
蘋果是可以吃的[信念世界存在的命題]
蘋果是紅色的[信念世界存在的命題]
西紅柿是紅色的[隱喻]
西紅柿是可以吃的[要認知的命題]->[加入懷疑世界]
11.需要什么機制和技術
不需要建立自有資料庫,只需要有結論和認知過程
需要有情報收集的能力(與各個情報來源建立通道,能識別相同情報)
需要有對情報的認知能力(歸類,推到,三個世界的命題集合)
12.云計算+大數據+數據挖掘+認知能力+學習機制
需要多久才能成長出為1個2~3歲兒童的智能,它的極限是那?
13.分詞–詞性標注–語言理解–信念世界–邏輯推理–懷疑世界–互聯網學習回饋確認機制-大數據級別的認知世界(人類記憶)–認知能力
只要求認知水果這類事物,甚至是 水果中的蘋果這個事物,需要多久,多深的技術,多大的投入?
14.與搜索引擎技術的區別
搜索引擎的目的是進行相關度排序,面對的是一個整體的互聯網數據;認知服務通過互聯網對現實世界進行認知,被認知的對象本身就是可以分類的,且數量是有限的。可以說從出發點上,認知服務比搜索站在更高一個層次。
15.與百度大腦、谷歌大腦、等人工智能的區別
傳統的人工智能是,通過“神經網絡”,“機器學習” “深度學習”等技術和理論,實現 像人類大腦一樣思考,像人類大腦一樣學習。
目標是,從源頭、原理、數學理論上突破,取得徹底的普遍的人工智能大腦,在實施的過程中不斷把新的發現,新的方法應用于它們現有的產品中去,提前為人類服務(但也許會像語音識別技術一樣走入 語義識別這樣的歧途)。
認知服務的目標是,收集互聯網的信息,通過認知后,得出現實世界發生的什么(首先要解決這個世界是什么樣的?),認知的過程是手段,
在當前 人工智能發展不成熟的階段,該手段可以不完美,認知出的結果,可以是不正確的,偏執的,神經質的,甚至是反人類的,只要有一套認知機制
結合包裝的產品(游戲、娛樂),現階段還是有市場的(看看微軟小冰的轟動和反響),產品占領市場后,可以慢慢的改進認知手段。
16.認知服務的價值–技術價值,個人/社會價值,商業/產品價值
了解技術深度,廣度,積累技術壁壘,程序化 認知模式,和認知過程
擴展個人的生活領域,“無知世界”縮小,程序化 認知模式,和認知過程中,提高自己的認知水平
核心技術,跨界,適合任意包裝產品,作為終生人工伴侶,和人的關系密切,可以形成收集個人數據并利用的閉環。
17.虛擬客服產品–低層次的分詞,分類知識庫[特定領域和行業]
我今天看到一個廠家做的東西,他們已經做了10年,還是在底層打轉,申請了一些專利,但應用也只做到 虛擬客服這個階段,
它的名字叫做“小i機器人”,它的解決方案、產品服務,
可以認為是具有認知服務的殼,做的是傳統知識庫問答的事,貌似存活得很好,而且獲得了以下6個專利:
一種實現網頁自動客戶服務的方法和裝置
一種對分享信息進行相應操作的方法、裝置和設備
一種用于進行語音識別的方法、裝置和設備
一種基于人工智能的知識問答快速處理系統
一種客服系統及客服信息推送方法
一種實現自動應答的系統及方法
其中第三個專利,2013年被蘋果申訴無效[因為Sir,不過該專利真心沒有價值,只是把語音識別的一般過程+后端知識數據庫結合一下就是一個專利,這還有活路嗎],但沒有成功,2014年蘋果把專利局和該公司一起告上法院,一審宣判敗訴,現在等待二審。