11月30日上午,百度云智峰會在北京召開,百度云事業(yè)部聯(lián)席總經(jīng)理劉煬表示“ABC”時代開始了。
何為ABC?劉煬表示,A代表智能、B代表大數(shù)據(jù),C代表云計算,這三者在技術(shù)、業(yè)務(wù)、產(chǎn)業(yè)等方面有非常緊密的結(jié)合,而百度云將自己定位于云計算、大數(shù)據(jù)、人工智能三位一體的公司,原因正是在此。
百度云聯(lián)席總經(jīng)理 劉煬
劉煬認(rèn)為,新時代背景下呈現(xiàn)出三個新特點:消費者驅(qū)動、數(shù)據(jù)爆炸和人工智能。他表示,從經(jīng)濟(jì)發(fā)展軌跡看,當(dāng)下的經(jīng)濟(jì)環(huán)境已經(jīng)從三十年前的產(chǎn)能不足發(fā)展成產(chǎn)能過剩,是一個消費者驅(qū)動的時代,誰能夠真正的洞察消費者,誰就可以掌握先機(jī)。隨著互聯(lián)網(wǎng)、物聯(lián)網(wǎng)的發(fā)展,消費者的數(shù)據(jù)、物聯(lián)網(wǎng)數(shù)據(jù),以及內(nèi)容數(shù)據(jù)正在充斥整個世界,企業(yè)需要從這些數(shù)據(jù)中獲得洞察,理解這些結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化的數(shù)據(jù),而人工智能則會讓技術(shù)對于這些數(shù)據(jù)的理解和洞察更準(zhǔn)確、更深入。
為此,百度云發(fā)布了人工智能平臺——“天智”,這也是繼“天算”、“天像”和“天工”三大平臺后,百度云發(fā)布的第四大平臺級解決方案。至此,百度云實現(xiàn)了人工智能、智能大數(shù)據(jù)、智能多媒體和智能物聯(lián)網(wǎng)全方位的智能平臺服務(wù)。
據(jù)了解,天智由感知平臺、機(jī)器學(xué)習(xí)平臺和深度學(xué)習(xí)平臺三部分組成。感知平臺主要包括圖像技術(shù)(文字識別和人臉識別)、語音技術(shù)(語音識別、語音合成和聲紋識別)和自然語言處理(NLP Cloud),可以應(yīng)用于智能客服、身份驗證、內(nèi)容審核等場景,應(yīng)用開發(fā)者可針對特定場景的應(yīng)用直接調(diào)用API。
劉煬介紹道,在人工智能技術(shù)研發(fā)方面,百度每年都要投入巨大的資金支持,并且已經(jīng)擁有了深厚的技術(shù)積累,其中百度語音識別入選2016年MIT十大突破性技術(shù),中文識別準(zhǔn)確率達(dá)到97%。
機(jī)器學(xué)習(xí)平臺是百度云端托管的機(jī)器學(xué)習(xí)服務(wù),可以打通機(jī)器學(xué)習(xí)全流程,內(nèi)置20多種高性能算法,并開放Spark MLlib,同時支持百度用戶畫像數(shù)據(jù),并提供多種應(yīng)用場景模版。
深度學(xué)習(xí)平臺具有靈活、高效、可伸縮、開源等特點。它支持多種神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和優(yōu)化算法以及自定義網(wǎng)絡(luò)配置,對于計算、存儲、架構(gòu)、通信等多方面多了細(xì)致優(yōu)化。它支持多核、多GPU、多機(jī)環(huán)境,其Paddle內(nèi)部技術(shù)已經(jīng)使用成熟,并實現(xiàn)對全球開發(fā)者的開放。深度學(xué)習(xí)平臺適用于精通深度學(xué)習(xí)的數(shù)據(jù)科學(xué)家,針對企業(yè)或研究部門的特定項目,需要大量的客戶標(biāo)注數(shù)據(jù)。
劉煬表示,借助天智平臺,企業(yè)和開發(fā)者可以便捷地獲得百度的人工智能技術(shù)能力,實現(xiàn)業(yè)務(wù)創(chuàng)新、提升用戶體驗等。百度天智將持續(xù)保持開放,推動各個行業(yè)的轉(zhuǎn)型,進(jìn)入ABC時代。
這幾年來,百度已陸續(xù)將人工智能技術(shù)用于搜索、安全、醫(yī)療、教育、無人車等每一個業(yè)務(wù)層次,人工智能不僅支撐著百度的核心業(yè)務(wù)發(fā)展,此次“天智”平臺的發(fā)布,也標(biāo)志著百度云通過天智、天算、天像和天工四大平臺向企業(yè)和開發(fā)者共享人工智能技術(shù)能力,推動整個行業(yè)的創(chuàng)新進(jìn)步。
以下是演講實錄:
各位嘉賓上午好,今天非常榮幸有機(jī)會在這里跟大家一起匯報一下百度在ABC這個時代的想法,ABC是什么意思呢?剛才張亞勤已經(jīng)做了一個解釋,A的話是AI,B的話是大數(shù)據(jù),C是云計算。ABC還有另外一個意思,大家知道ABC是英文26個字母的三個首字母,對于首字母來講ABC代表一個時代的開始。
既然我們提到一個時代,首先我們看看這個時代有什么樣的特征。首先我們看到這個時代是一個消費者驅(qū)動的時代,我是70后,我相信在座的有不少朋友經(jīng)歷過三十年前我們很多東西需要票的,有糧票、飯票、菜票等等幾兩幾兩的。為什么有票呢?三十年前是一個產(chǎn)能不足的時代,供不應(yīng)求,所以過去的三十年里面大家又看到中國的歷史發(fā)展的話主要的精力都在做提升生產(chǎn)力。IT作為一個行業(yè)的話,在這個過程中扮演了一個非常重要的角色,整個IT的話我們幫助進(jìn)行這個流程自動化。所以過去的三十年間,整個這個IT的話主要是以流程自動化的方式在大幅度提升這個生產(chǎn)力,必須說過去的三十年是非常非常成功的三十年。
今天的話我們很快,短短三十年里面,已經(jīng)從產(chǎn)能不足到了一個產(chǎn)能過剩的時代了。今天大家更多的不是擔(dān)心東西造不出來,而是東西賣不出去。所以今天已經(jīng)成為一個消費者驅(qū)動的一個時代了,誰能夠把東西賣給消費者,誰能夠真正的洞察消費者,誰就可以掌握先機(jī),今天是一個消費者驅(qū)動的時代到來。第二個時代是數(shù)據(jù)爆炸的時代到來。這個和前面非常相像,我們看到有幾種類型的數(shù)據(jù)爆炸,一種是消費者行為數(shù)據(jù)在爆炸。像百度、BAT等等國際上所有的互聯(lián)網(wǎng)公司發(fā)展起來基本上都是在做消費者行為大數(shù)據(jù),所有這些公司今天能夠發(fā)展到這樣一個規(guī)模的話,都是因為消費者行為數(shù)據(jù)在大量的收集,并且在應(yīng)用這些消費者行為大數(shù)據(jù)的話,產(chǎn)生了很多的產(chǎn)品,今天我們不斷的看到消費者上網(wǎng)的人數(shù)在不斷的上升,中國現(xiàn)在已經(jīng)是七億互聯(lián)網(wǎng)網(wǎng)民了,同時越來越多的設(shè)備也在收集消費者行為,用戶行為的數(shù)據(jù)。
所以第一個爆發(fā)的數(shù)據(jù)是消費者行為數(shù)據(jù),所以前面的消費者驅(qū)動時代的到來幾乎是同時的發(fā)展的,第二個爆發(fā)的數(shù)據(jù)是物聯(lián)網(wǎng)數(shù)據(jù),這個不用說了,就是說到2020年,260億的設(shè)備上網(wǎng),40個CB的數(shù)據(jù)上網(wǎng),這都是物聯(lián)網(wǎng)數(shù)據(jù)在爆發(fā),第三個數(shù)據(jù)是很容易被忽略的,內(nèi)容大數(shù)據(jù),我們看到內(nèi)容數(shù)據(jù)也是在不斷的上升,像圖片和視頻。我們今天很多朋友拿手機(jī)拍照片,上傳到像百度網(wǎng)盤這樣的設(shè)備里面。那么百度網(wǎng)盤每年的數(shù)據(jù)的增長量幾乎都在每年翻番的速度在增長。所以這一類數(shù)據(jù)和前面兩類數(shù)據(jù)有一點不同,前面兩類數(shù)據(jù)往往是結(jié)構(gòu)化,半結(jié)構(gòu)化的數(shù)據(jù),這一類的內(nèi)容的數(shù)據(jù)往往都是非結(jié)構(gòu)化的數(shù)據(jù),所以處理結(jié)構(gòu)化,半結(jié)構(gòu)化的數(shù)據(jù),像Hadoop這樣大數(shù)據(jù)平臺的話,很多能夠成立結(jié)構(gòu)化,半結(jié)構(gòu)化,對于內(nèi)容數(shù)據(jù)的話我們往往需要理解內(nèi)容,所以人工智能的數(shù)據(jù)需要跟著這些數(shù)據(jù)大規(guī)模的起來。
所以我們看到第三個時代的到來,人工智能的時代到來。人工智能不是一個新概念,有60多年歷史了,過去的發(fā)展也經(jīng)歷過起伏,為什么今天人工智能的發(fā)展這么快呢?核心的來講是深度學(xué)習(xí)的技術(shù)突破。左邊這張圖的話就展現(xiàn)了一下,老的一些算法的話,數(shù)據(jù)增大之后邊際遞減比較快,效果隨著數(shù)據(jù)的增加就不會再增加,而人工智能是數(shù)據(jù)增加以后,效果會不斷的增加,所以人工智能和算法數(shù)據(jù)爆炸時代相結(jié)合的話,就形成了人工智能這么熱,這么火一個很重要的原因。
剛剛這三個時代的到來,大家可以看到是環(huán)環(huán)相扣的,消費者時代的到來,大家對消費者行為數(shù)據(jù)的大規(guī)模的收集和理解,引起了我們大數(shù)據(jù)的規(guī)模的發(fā)展,同時我們推動了互聯(lián)網(wǎng)大數(shù)據(jù)的處理,同時由于消費者行為數(shù)據(jù)的大幅度的增加,我們越來越多的內(nèi)容數(shù)據(jù)也是在不斷的增加,這些數(shù)據(jù)需要更好的算法和更好的人工智能的能力,所以緊跟著人工智能也是在這個大環(huán)境下大規(guī)模的爆發(fā)。
所以我們看到ABC這三個東西不是說拼湊起來的,ABC之間是有著非常天然的緊密的,不但是技術(shù)上,也有業(yè)務(wù)上,產(chǎn)業(yè)上的緊密相關(guān)的聯(lián)系。百度作為一家中國的互聯(lián)網(wǎng)平臺級公司,我們一直也是說沿著這樣一個邏輯,沿著這樣一條路線走過來。我們在云計算、大數(shù)據(jù)、人工智能都有多年的一個積累和沉淀,我們的視野后面相信這是一個時代的需求。所以我們一直給自己的定位就是說云計算、大數(shù)據(jù)、人工智能,三位一體的這樣一個云計算平臺。
2016年的話可以說是百度云的一個元年,在今年的話,我們七月份,正式對外,也是發(fā)布了百度云計算的戰(zhàn)略,十月份的話也是進(jìn)行了品牌的升級,從過去叫做百度開放云,重新命名為百度云。今天的話我們也是作為這個首次的百度云智峰會來給大家見面。所以我們說2016年是一個百度云的商業(yè)元年,2016年是誕生的元年,我們孕育過程中很長,有十幾年的技術(shù)積累,今年之前百度云的團(tuán)隊也成立了,進(jìn)行了很多研發(fā),這些使得我們能夠非常快速的推出很多的新產(chǎn)品,到今天的話,百度云上面我們已經(jīng)有80幾款產(chǎn)品了,所以的話,大家也可以到我們的官網(wǎng)上對這些產(chǎn)品有更多的了解。
這里花幾分鐘的時間把我們的產(chǎn)品給大家做一個簡要的匯報,七月份的戰(zhàn)略發(fā)布會上,我也是給大家介紹了百度的基礎(chǔ)云、天算、天像、天工的智能平臺,基礎(chǔ)云是云基礎(chǔ)設(shè)施,天算是智能大數(shù)據(jù)平臺,天像是智能多媒體平臺,天工是智能互聯(lián)網(wǎng)平臺。首先看基礎(chǔ)云,提供了從計算到存儲、到網(wǎng)絡(luò)、到安全整個完整的基礎(chǔ)架構(gòu)的設(shè)施。那么百度的基礎(chǔ)架構(gòu)是基于百度多年的發(fā)展,我們今天擁有中國最大的自己建設(shè)的互聯(lián)網(wǎng)數(shù)據(jù)中心。我們有非常多的專列在這個硬件的研發(fā)上的專利,我們的存儲,經(jīng)過了百度網(wǎng)盤的考驗,我們的存儲是中國最大的存儲系統(tǒng),同時我們提供了完整的,一般的分級的存儲機(jī)型,可以有多附本和低附本的,可以適用于一般的也可以備用的場景等。
今天下午我們在分論壇上也會向我們ABC的網(wǎng)絡(luò)設(shè)備的產(chǎn)品的話正式對外開放,所以我們在整個的基礎(chǔ)云領(lǐng)域的話投入了非常多,也做出了非常多的事情。
天算的話是希望能夠提供一個完整的,從數(shù)據(jù)收集,到數(shù)據(jù)存儲,到數(shù)據(jù)分析,再到最上層的專項方案到行業(yè)方案一套完整的解決方案,能夠幫助大家把這個數(shù)據(jù)處理好,能夠把這個數(shù)據(jù)真正用起來,因為數(shù)據(jù)爆炸時代必須要有一套完整的后臺體系,能夠支撐數(shù)據(jù)從數(shù)據(jù)資源變成真正的業(yè)務(wù)價值。
天像是這個智能多媒體平臺,前面提到了今天是內(nèi)容數(shù)據(jù)大爆炸的時代,天像主要是針對內(nèi)容數(shù)據(jù)的,所以天像我們原來取明叫做天涯咫尺、包羅萬象,就是講天像很重要的一點,能夠幫助把你把這個內(nèi)容給到天涯之外的人,像咫尺一樣,在內(nèi)容分發(fā)等領(lǐng)域做了很多的事情,包羅萬象是指天像是含有不同的各種內(nèi)容,無論是文本、還是音頻,還是圖像、直播等等的內(nèi)容,這些內(nèi)容在天像平臺上都可以進(jìn)行支持。所以天像的話,如果你有什么內(nèi)容數(shù)據(jù)需要支持的話,無論是什么類型,無論是什么樣的方式傳遞給你的消費者的話,天像平臺都可以提供非常強(qiáng)大的支持。
天工是智能物聯(lián)網(wǎng)平臺,剛剛提到了三個數(shù)據(jù)大爆炸里面,其中有一個是物聯(lián)網(wǎng)數(shù)據(jù)大爆炸,我們也非常看好物聯(lián)網(wǎng)這個時代的到來。所以天工的話事實上是說我們可以提供全方位的支持,從端上面的數(shù)據(jù)采集到通過工業(yè)協(xié)議,將數(shù)據(jù)傳遞到云上,在云上進(jìn)行設(shè)備的管理和可視化的展現(xiàn),同時的話,我們也比較特殊的支持實時數(shù)據(jù)庫,這是物聯(lián)網(wǎng)時代一個非常有用的東西。更重要的一點,天工和后臺的天算平臺和整個百度云可以進(jìn)行深度集成,所有的數(shù)據(jù)在云上,使用我們所有的大數(shù)據(jù)的能力進(jìn)行處理。
簡單的介紹了一下剛才提到的這個百度云在七月份的發(fā)布,接下來這些平臺都會有分論壇,在分論壇里面會對所有的產(chǎn)品進(jìn)行一個更全面,更詳細(xì)的闡述。
今天的話,我們必須要談下一幕是什么?我相信大家看到這三個字毫無疑問可以猜出來是后面四個字是什么,對,是希望人工智能。在今年的人工峰會和百度峰會上都在提出來下一步人工智能的概念,今天來講人工智能已經(jīng)成為整個百度的核心戰(zhàn)略,百度非常多的基礎(chǔ)研發(fā)都是圍繞著人工智能來進(jìn)行的。
所以今天的話,也是借這個機(jī)會,借這個場合我們推出一個新的在百度云上的平臺,天智平臺,這是人工智能平臺,天智這個名字來自于哪里呢?來自于韓非子,一一篇文章其中提到了人也者,乘與天明以視,寄于天聰以聽,托于天智以思慮,這句話什么意思呢?我也不是古文專家,我的理解是這樣的,人依靠自然生存的視力去看,依靠自然生存的耳朵去聽,一號自然生存的思維的能力去進(jìn)行思慮。這句話后面下面一段是什么呢?下面一段說如果一個人用眼過度,目光就會模糊,如果一個人用耳朵過渡,聽覺的話也會受損,如果一個人思慮太多也會使他的神志受到影響。所以這是韓非子在這句話后面的一句話。我覺得這句話很契合我們天智平臺所推出的原因。我們其實推出天智的原因是讓天智幫助你聽,讓天智幫助你看,讓天智幫助你思考,減輕你過渡的聽、看、思考的負(fù)擔(dān),讓大家能夠把更多的精力放在更有意義,更有創(chuàng)造性的事情上。所以這是我們天智平臺的名字的來源,以及我們天智平臺所期望達(dá)到的愿景。
剛才提到了人工智能的話,作為一個百度戰(zhàn)略,百度在上面投入了非常非常多投入。我們首先看一下我們在百度,在這個人工智能的視野上到底是怎么樣的,百度是做搜索起家的,同時的話,我們主要收入來源靠百度推廣,所以無論是推廣還是搜索,都是已經(jīng)在過去大量使用積極學(xué)習(xí)的方法,人工智能的方法在我們的系統(tǒng)中。除此之外我們在2012年百度是中國互聯(lián)網(wǎng)公司里面最早成立專門的研究院來布局人工智能。我們在美國的話,有美國的研究院,同時的話我們在北京也有北京的深度學(xué)習(xí)研究院,大數(shù)據(jù)研究室,我們在自然語言的理解和圖像和語音等等方面都是有非常多的投入。
同時,百度也花了很大的精力會聚世界上最優(yōu)秀的全球頂尖人才,像我們的首席科學(xué)家是全世界人工智能領(lǐng)域首屈一指的科學(xué)家,張亞勤也是在這個領(lǐng)域里面非常資深的科學(xué)家。
正是因為這樣的投入,在2016年,麻省理工科技評論中,在評選了全球最聰明的50家公司里面的話,百度名列第二,這主要的原因是我們在人工智能上的非常大的投入。
同時就是說百度在研發(fā)的投入上非常大,我們收入的百度15.89的比例是投入在研發(fā)里面,這個比例在中國所有公司里面,應(yīng)該說在研發(fā)強(qiáng)度上最大的公司。
那么,這么大的投入,在人工智能領(lǐng)域里面,今天百度的人工智能到底突破到了哪里了呢。以前有一個講法,現(xiàn)在人工智能的能力到了一個幾歲小孩兒的水平,我們后來自己思考的話,其實這個說法也不是很恰當(dāng),因為比方說三歲的小孩子,他要做一個乘法都做不出來,而這一點幾十年前的計算機(jī)就可以做了。另外一個方面,三歲小孩兒所能表達(dá)出來的創(chuàng)意和情感、情緒,這些東西,事實上今天的,用百度幾十萬臺機(jī)器的話也并不一定能夠完全的模擬。所以我們覺得很難用一個簡單的說法來講智能到了幾歲小孩兒的水平來描述。
那么怎么樣來描述呢能夠讓大家很容易聽懂,我們總結(jié)了兩句話,基本上今天的百度人工智能做到什么程度呢,比如說一個正常人一秒鐘能夠做的事情,百度人工智能也基本上可以做好。另外一個是假如你有大量的數(shù)據(jù),大量的重復(fù)事件的數(shù)據(jù),你想預(yù)測下一次到底怎么樣的話,那么百度的人工智能能力基本上也可以做好。這是今天百度人工智能能力今天已經(jīng)突破到了一個境地。
那么我們簡單的來看一下第一個的話是語音識別,百度的語音識別是世界上最早使用深度學(xué)習(xí)的方法來進(jìn)行的Deepspeech語音識別的系統(tǒng),中文識別率大于97%,同時目前的MAT2016年十大突破,傳統(tǒng)的語音識別經(jīng)過了多個分段的模型,從最開始的到音素再到語言模型進(jìn)行一個轉(zhuǎn)型,得到最后的結(jié)果。但是事實上大家知道我們自己人進(jìn)行語音理解的時候是沒有這些階段的,基本上聲音聽到了馬上在腦袋里面就變成了最后的理解的涵義。不會有多階段的模型的轉(zhuǎn)化。那么今天基于這樣的思想,百度在深度學(xué)習(xí)領(lǐng)域里面的大規(guī)模的研究和突破的話,今天百度也是完全采用了深度學(xué)習(xí)的方式,多層的神經(jīng)網(wǎng)絡(luò),而不再是使用像過去一樣進(jìn)行聲學(xué)模型、聲素模型和語音模型等等的多層轉(zhuǎn)換,也正是因為這樣的新技術(shù)使得百度在語音識別上的能力有了大幅度的突破。
第二個例子看看從圖像,因為大家知道圖像的數(shù)據(jù),今天是爆發(fā)性的增長,越來越多。而且圖像,人的眼睛其實是人獲取信息最大一個渠道,百聞不如一見啊,就是說眼睛是人獲取信息最大的一個渠道。所以圖像的話在各個領(lǐng)域的使用也是越來越多。舉一個例子,這個圖像應(yīng)用在真假的識別,到底是真還是假,百度在這個領(lǐng)域做的也是非常多,包括了人臉的識別,圖像的識別。圖象識別的情況下,即便這一個圖像的質(zhì)量很差,比如說光很暗的情況下,百度的圖象識別可以遠(yuǎn)遠(yuǎn)高與人眼的識別能力,像很暗的人,我也可以判斷出是不是真,是不是假。另外我們?nèi)四樧R別可以做非常好的活體檢驗。一個人動的話我們在非常快的時間內(nèi)就可以判斷出來這個人是不是在動,同時的話這個人在動的過程中可以把臉部的圖像進(jìn)行和身份的引證。手寫簽名也是一個例子,很多的銀行等領(lǐng)域需要用手寫簽名來判斷,今天這個手寫簽名也可以做到這個非常高的識別率。
除了從圖像中識別真假的話,更重要的,更有用的事情是從圖像中識別內(nèi)容。這里面有三個例子,第一個例子是從圖像中去尋找文字,這個的話事實上是傳統(tǒng)中大家所說的OCR,OCR也不是一個新概念了,但是過去這幾年,OCR的技術(shù)是突破得非常快的。因為過去也像語音一樣早期的OCR的話也是采用了,分了很多段的模型。今天的OCR已經(jīng)是大量使用深度學(xué)習(xí)的方法了,像人一樣,一眼看上去不會把一個文字先分解成筆劃,而是通過一個整體方式去獲取信息。百度OCR在國際文檔分析和識別大會的去年競賽中獲得了四個領(lǐng)域的世界第一。也就是說總分的話也是世界第一。所以百度在OCR的領(lǐng)域事實上做了非常多的事情,很多的產(chǎn)品,比如說像作業(yè)幫的拍一張題目,放一個詞出來,在圖書中拿出來文字,也相當(dāng)與拿一個菜單拍照,結(jié)合百度翻譯把菜名從中文翻譯成英語等等很多的領(lǐng)域都是在OCR。所以O(shè)CR今天已經(jīng)是進(jìn)入了一個特別實用的時代了。
除了OCR之外,我們還支持從這個圖像中去分別內(nèi)容,比如說第二張圖,問沖浪板是什么顏色,黃色,事實上這看上去很簡單,但是很重要的一點,需要從這張圖里面去尋找,哪一個部分是沖浪板。不但是有對圖形的識別,我們也支持視頻的識別。后面這個視頻中可以講述大致是什么樣的內(nèi)容。
當(dāng)然,人工智能不會只停留在這些領(lǐng)域,還會大量的使用在百度的無人車的領(lǐng)域,今天百度在無人車和自動駕駛領(lǐng)域投入很大,我們同時投入L3和L4,既包括全自動的人工智能,也包括高度輔助的這個自動駕駛。今天的話,人工智能其實是一個,無人車是一個人工智能集大成的領(lǐng)域。非常多的技術(shù)都在無人車上使用,語言分析、分析決策、高清地圖、圖象識別、規(guī)劃行動和智能推薦等等。剛剛過去的烏鎮(zhèn)互聯(lián)網(wǎng)世界大會上,百度的18輛無人車在現(xiàn)場給大家做了非常多的演示,很多的朋友去嘗試乘坐了百度無人車,當(dāng)然,無人車的路還很長,需要更多的人工技術(shù)去投入和發(fā)展。
綜合前面所有的技術(shù),百度在今年9月份首次向外界全面披露了百度人工智能的成果,包括了剛剛提到了語音技術(shù)、圖像技術(shù)、自然語言處理和機(jī)器學(xué)習(xí)的平臺和用戶畫像等值。九月份百度向大家全面展示了百度人工智能的成果。
今天的話,百度大腦的能力通過我們的天智平臺對外開放。所以天智平臺,像剛剛所提到的所有的人工智能的能力的話,對外進(jìn)行輸出,對外進(jìn)行開放。
那么接下來我花一點時間介紹一下天智平臺到底包括了什么,我們這次發(fā)布了什么,天智平臺,基本上分為三個子平臺,分別是感知平臺,機(jī)器學(xué)習(xí)平臺和深度學(xué)習(xí)平臺。我接下來稍微介紹一下這三個平臺各自干什么的。
感知平臺主要輸出是圖像技術(shù)、語音技術(shù)、自然語言處理的技術(shù)。圖像技術(shù)的話包括了文字識別、人臉識別等等,語音技術(shù)包括了語音的識別和語音的合成,聲紋的識別等等。自然語言處理的話包括了百度的NLP Cloud的能力,也會對外進(jìn)行輸出。如果你想很容易的記住這個感知平臺干什么的話,大家就記住一個字,聰明的“聰”,聰是由耳目口心組成的,所以耳朵干的事情,百度的感知平臺上可以聽,可以理解,眼睛能干的事情,我們會把圖象識別和視頻識別的技術(shù)進(jìn)行對外開放。嘴巴能干的事情,把自然語言合成,然后生成帶情感的自然語言進(jìn)行輸出,可以在這個平臺上完成。我們還要對內(nèi)容進(jìn)行理解。
所以感知平臺其實有一個特點,基本上的話基于百度自己搜集的大量的人機(jī)交互的數(shù)據(jù)來進(jìn)行這個機(jī)器學(xué)習(xí)來生產(chǎn)模型,最終的話我們感知平臺可以提供一個API,由外部直接進(jìn)行調(diào)用。所以對感知平臺的使用者其實不需要懂人工智能的技術(shù)的細(xì)節(jié),因為感知平臺包裝出來的API基本上都是應(yīng)用級別了,像輸入一段語句,我們可以把文本自動翻譯出來,或者是說輸入文本把自然的語音輸出出來,所以對于感知平臺使用者來說不需要懂機(jī)器學(xué)習(xí)也不需要積累大量的數(shù)據(jù),百度已經(jīng)做好了這件事。所以應(yīng)用開發(fā)者可以直接使用感知平臺,應(yīng)用開發(fā)者很重要的一點為感知平臺尋找非常好的應(yīng)用場景。
第二個平臺是機(jī)器學(xué)習(xí)的平臺,機(jī)器學(xué)習(xí)平臺跟感知平臺不一樣,機(jī)器學(xué)習(xí)平臺事實上是一個托管服務(wù)。在機(jī)器學(xué)習(xí)的平臺上我們將完整的數(shù)據(jù)訓(xùn)練的流程打通,我們機(jī)器學(xué)習(xí)平臺和天算平臺,和我們的智能大數(shù)據(jù)平臺,是進(jìn)行了一個深度的集成。所以這個平臺上的話,我們打通了機(jī)器學(xué)習(xí)的全流程,我們內(nèi)置了二十多種常用的機(jī)器學(xué)習(xí)的算法。同時的話,我也支持業(yè)界標(biāo)準(zhǔn)的Spark MLlib,同時也對應(yīng)了百度內(nèi)部的非常多的數(shù)據(jù)和常用模板。機(jī)器學(xué)習(xí)是什么內(nèi)容呢?第一個是你自己得有數(shù)據(jù),機(jī)器學(xué)習(xí)到哪了,一秒鐘的時間可以解決的事情,我們通過感知平臺可以解決。另外是如果有大量重復(fù)發(fā)生的數(shù)據(jù)需要進(jìn)行預(yù)測的話,百度的機(jī)器學(xué)習(xí)平臺的話實際上是非常適合這樣的場景的。
比如說我們在物流領(lǐng)域里面如果有大量的過去的傳輸?shù)臄?shù)據(jù)的話,這可以預(yù)測下一次從一個地方到另外一個地方要花多長時間哪一條路最好,這適合機(jī)器學(xué)習(xí)平臺去解決的。所以機(jī)器學(xué)習(xí)平臺需要團(tuán)隊里有數(shù)據(jù)工程師,需要他來理解數(shù)據(jù)的流程和特點,需要懂一點點機(jī)器學(xué)習(xí)的常識,在平臺上把數(shù)據(jù)玩轉(zhuǎn),所以機(jī)器平臺主要是適合這樣的朋友。
第三個平臺是深度學(xué)習(xí)平臺,百度也是在九月份在百度內(nèi)部最有名的深度學(xué)習(xí)的框架對外進(jìn)行開源。那么,paddlepaddle是百度內(nèi)部大量的數(shù)據(jù)系統(tǒng)組成的深度學(xué)習(xí)的平臺,今天對全球開發(fā)者進(jìn)行開放。這是非常多的神經(jīng)網(wǎng)絡(luò)的算法,同時非常高效也非常靈活,如果是小規(guī)模的數(shù)據(jù)進(jìn)行研究的話,可以單機(jī)進(jìn)行,如果說數(shù)據(jù)量大一點,一個分布式系統(tǒng)可以運行,如果數(shù)據(jù)量特別大的話需要有CPU的集群來進(jìn)行這樣一個能力來學(xué)習(xí)。今天paddlepaddle開源了,大家可以在自己的機(jī)器上進(jìn)行搭建和使用。同時在百度云上我們將paddlepaddle服務(wù)化,您自己沒有機(jī)器,希望快速使用paddlepaddle的話,在我們百度云的平臺上也可以來使用。
那么深度學(xué)習(xí)平臺使用適合于誰?深度學(xué)習(xí)平臺因為今天已經(jīng)非常簡單化了,更適合與數(shù)據(jù)科學(xué)家,對數(shù)據(jù)的模型運作有深刻的理解才能夠來使用這個數(shù)據(jù)學(xué)習(xí)平臺。您是一個創(chuàng)新型的,專門做人工智能領(lǐng)域的公司,或者是說您是有非常非常大量的數(shù)據(jù)能夠找好的數(shù)據(jù)科學(xué)家來進(jìn)行解決問題的公司的話,深度學(xué)習(xí)平臺是一個非常好的平臺。
所以綜上的話百度天智平臺由三個部分組成,感知平臺,深度學(xué)習(xí)和機(jī)器學(xué)習(xí)平臺,這樣的場景對應(yīng)各自不同的公司的數(shù)據(jù),您做應(yīng)用開發(fā),把人機(jī)交互的能力做得很好,希望能夠做大量的語音圖像等等的領(lǐng)域的事情,歡迎使用感知平臺,如果您自己手上有大量的數(shù)據(jù),希望從這個數(shù)據(jù)中去挖掘出能力,歡迎大家使用這個機(jī)器學(xué)習(xí)的平臺。如果您有超大量的數(shù)據(jù),同時的話,您這里有數(shù)據(jù)科學(xué)家,可以幫助您處理的話,我們歡迎大家來使用深度學(xué)習(xí)平臺。
當(dāng)然,今天的話天智是1.0的發(fā)布,未來還有很長的路要走,今天我們在機(jī)器學(xué)習(xí)領(lǐng)域我們認(rèn)為我們還處在一個感知的時代,后面還有非常長的路要走來解決認(rèn)知的問題。所以我也是希望隨著百度在人工智能的領(lǐng)域不斷的積累,不斷的將越來越多的能力通過天智平臺進(jìn)行對外訴求。
所以最后我們也是非常看好整個人工智能在未來所有的行業(yè)里面的應(yīng)用。O2O、物流、智能家居、醫(yī)療、金融、智能終端等等所有領(lǐng)域都有非常大的,非常強(qiáng)的人工智能的場景。所以我也是希望百度云能夠服務(wù)好各位,我們一起攜手來讓人工智能,大數(shù)據(jù)和云計算的能力在更多的領(lǐng)域里面開花結(jié)果,好,謝謝大家。