談及人工智能的應(yīng)用,胡郁認(rèn)為,有兩類客戶非常期待著通過云計(jì)算獲得人工智能。一類是大企業(yè),特別是傳統(tǒng)企業(yè),比如說家電廠商、汽車廠商,但是他們并不一定懂人工智能,或者是人才有限,大多數(shù)集中在互聯(lián)網(wǎng)廠商里面。另一類是很多的開發(fā)者想來(lái)做人工智能的運(yùn)用或者是創(chuàng)新的門檻太高,不可能每個(gè)開發(fā)者建自己的人工智能的系統(tǒng)。通過開放平臺(tái)的方式,可以非常便宜利用云計(jì)算和大數(shù)據(jù)的平臺(tái)獲取已經(jīng)成熟的語(yǔ)音識(shí)別、圖像識(shí)別的各種人工智能的算法。
以下為發(fā)言實(shí)錄:
何剛:謝謝洪小文先生的關(guān)于ABC的改造,toB端的改造產(chǎn)品運(yùn)行,更多監(jiān)管的必要性,胡郁先生,請(qǐng)您闡述您的看法。
胡郁:好的。今天非常高興到世界科技創(chuàng)新論壇,確實(shí)就像洪院長(zhǎng)說的,也是很少有現(xiàn)在AI這么熱,但是今天專門討論數(shù)據(jù)洪流,我一直有一個(gè)想法,這次的AI能夠起來(lái),其實(shí)和我們的數(shù)據(jù)洪流的發(fā)展是緊密不可分的。為什么這么說?我不知道大家還記不記得前幾年非常有名的一本書叫做大數(shù)據(jù)方面的。大家還記得當(dāng)時(shí)關(guān)于大數(shù)據(jù)的理論,其實(shí)和現(xiàn)在我們AI所需要的大數(shù)據(jù)還是有本質(zhì)性的差別。為什么這么說?當(dāng)時(shí)講大數(shù)據(jù)的時(shí)候,是講我們更應(yīng)該關(guān)注數(shù)據(jù)的叫相關(guān)性,而不是邏輯性。什么意思?因果關(guān)系我不一定非常在意,但是我要看數(shù)據(jù)之間有沒有依存的聯(lián)系。當(dāng)時(shí)的大數(shù)據(jù)理論認(rèn)為通過相互之間依存的聯(lián)系能干很多事情。但是其實(shí)在這之上,也就是最近10年,人工智能在大數(shù)據(jù)的基礎(chǔ)上發(fā)展起來(lái),恰恰是走到另外一個(gè)方面,是什么方面?就是利用中間的邏輯性,大家可能會(huì)覺得很奇怪。直接采集里的大數(shù)據(jù)中間如何蘊(yùn)藏了邏輯性,這跟以前的大數(shù)據(jù)的觀點(diǎn)不一樣。但是其實(shí)這一點(diǎn)分析起來(lái)比較簡(jiǎn)單,就是說什么?其實(shí)數(shù)據(jù)之間的邏輯性是由人來(lái)填補(bǔ)的,比如說做一個(gè)圖像識(shí)別或者是語(yǔ)音識(shí)別,采集大量的大數(shù)據(jù),但是想來(lái)訓(xùn)練我們的語(yǔ)音識(shí)別或者是圖像識(shí)別的東西,必須加上一維或者多維的相關(guān)數(shù)據(jù),這個(gè)數(shù)據(jù)由人類對(duì)語(yǔ)音或者是圖像打上了邏輯性的標(biāo)簽,就是人的智慧來(lái)判斷數(shù)據(jù)里面哪一的最后的結(jié)果有邏輯的關(guān)系。只有這樣有人參與的大數(shù)據(jù),才能用做人工智能的大數(shù)據(jù)的來(lái)源。
講到這里我舉一個(gè)例子大家就明白了,2010年以前中文的語(yǔ)音識(shí)別是完全不能用的,為什么?因?yàn)樵瓉?lái)這些數(shù)據(jù)并不是真實(shí)環(huán)境中的數(shù)據(jù),在實(shí)驗(yàn)室里面好不容易采集了2000小時(shí),但是真正訓(xùn)練數(shù)據(jù)的話,訓(xùn)練語(yǔ)音識(shí)別的模型遠(yuǎn)遠(yuǎn)不夠。2010年以前沒有人敢在公開場(chǎng)合或者是使用語(yǔ)音識(shí)別技術(shù)。這幾年為什么語(yǔ)音識(shí)別、圖像識(shí)別雨后春筍一般突破了使用的門檻,就是因?yàn)椴捎昧嗽朴?jì)算、大數(shù)據(jù)和我們剛剛講的方法。
為什么這么說?因?yàn)樵瓉?lái)的原始方法把一個(gè)人叫到實(shí)驗(yàn)室錄圖像或者是語(yǔ)音的數(shù)據(jù)要耗費(fèi)大量的成本,現(xiàn)在通過云計(jì)算,通過開元的或者是免費(fèi)的一些服務(wù),讓真正最后的使用者,他們?cè)丛床粩嗤ㄟ^使用這些軟件或者是服務(wù)甚至開元的東西,向云計(jì)算的后臺(tái)提供了大數(shù)據(jù)。而且數(shù)據(jù)在過程中也加上了我們剛講的邏輯性的標(biāo)簽,成為數(shù)據(jù)的維度。才用了三到四年的時(shí)間突破了我們講在圖像和語(yǔ)音方面的技術(shù)。所以說,我覺得本身人工智能的發(fā)展,就得益于我們講的數(shù)字洪流的不斷進(jìn)步,如果沒有這些基礎(chǔ)設(shè)施,云計(jì)算、大數(shù)據(jù),我相信人工智能這次不會(huì)取得這么突飛猛進(jìn)的發(fā)展。
最后我講一點(diǎn)關(guān)于運(yùn)用。大家都知道通過云計(jì)算的方法,有兩類客戶非常期待著通過云計(jì)算獲得人工智能。一類是大企業(yè),特別是傳統(tǒng)企業(yè),比如說家電廠商、汽車廠商,但是他們并不一定懂人工智能,或者是人才有限,大多數(shù)集中在互聯(lián)網(wǎng)廠商里面。這樣的話,其實(shí)將來(lái)每一個(gè)傳統(tǒng)企業(yè)也好科技企業(yè)也好,需要自己的云計(jì)算和大數(shù)據(jù)和人工智能。這里面可能存在一些人工智能企業(yè)和這些所有的大B客戶,大型企業(yè)的深入合作,這些深入合作是要以數(shù)據(jù)、經(jīng)驗(yàn)、知識(shí)、品牌和將來(lái)的分享利益之間進(jìn)行深度合作的,他們包括云計(jì)算和大數(shù)據(jù)的分享。我們把這種生態(tài)體系叫做混合正交的商業(yè)生態(tài)。另外一方面我們看到很多的開發(fā)者想來(lái)做人工智能的運(yùn)用或者是創(chuàng)新的門檻太高,不可能每個(gè)開發(fā)者建自己的人工智能的系統(tǒng)。通過開放平臺(tái)的方式,比如說現(xiàn)在訊飛開放平臺(tái)也擁有了90萬(wàn)的開發(fā)者,可以非常便宜利用云計(jì)算和大數(shù)據(jù)的平臺(tái)獲取已經(jīng)成熟的語(yǔ)音識(shí)別、圖像識(shí)別的各種人工智能的算法。這樣的話,為我們國(guó)家的創(chuàng)新創(chuàng)業(yè)業(yè)提供了一個(gè)很好的手段。我相信數(shù)字洪流的發(fā)展一定會(huì)持續(xù)推進(jìn)我們?cè)谌斯ぶ悄埽诟鱾€(gè)傳統(tǒng)行業(yè)轉(zhuǎn)型中的各個(gè)步驟和過程。謝謝大家。