2014百度世界大數(shù)據(jù)論壇于9月3日在北京舉行,會(huì)上既有來(lái)自百度大數(shù)據(jù)的專(zhuān)家介紹百度的大數(shù)據(jù)產(chǎn)品和發(fā)展經(jīng)驗(yàn),也有來(lái)自各行各業(yè)的精英介紹他們與百度在實(shí)際合作中的心得。
百度大數(shù)據(jù)的價(jià)值——感知世界
百度大數(shù)據(jù)部高級(jí)總監(jiān)朱永忠講到百度大數(shù)據(jù)給行業(yè)帶來(lái)的最大價(jià)值即時(shí)感知世界。所謂感知世界就是讓機(jī)器能夠模擬人腦的方式處理感知到的所有信息。而能夠像人腦那樣處理感知的信息之后,隨之給行業(yè)帶來(lái)的價(jià)值即是類(lèi)似人腦活動(dòng)的思考和決策。
對(duì)此百度推出的產(chǎn)品是百度大腦。百度大腦依托圖像識(shí)別技術(shù)、語(yǔ)音識(shí)別技術(shù)、手術(shù)識(shí)別技術(shù)、自然語(yǔ)言理解技術(shù)等識(shí)別技術(shù)將一系列信息整合在一起,能夠更加接近自然,從第一人稱(chēng)的角度感知周?chē)氖澜纭?/p>
而這給行業(yè)帶來(lái)的直接價(jià)值即是能夠更好的管理用戶(hù)。以往在網(wǎng)絡(luò)上流行著一句名言“你不知道電腦對(duì)面的是一條狗還是一個(gè)人”,而百度大腦所具有的感知能力毫無(wú)疑問(wèn)知道對(duì)面是一個(gè)人,而且能夠?qū)λ鎸?duì)的用戶(hù)有更多的了解,使用戶(hù)的畫(huà)像更加清晰。這樣行業(yè)可以更加全面的了解自己用戶(hù)的特點(diǎn),有哪些需求,能夠更針對(duì)性的面向用戶(hù)進(jìn)行推廣和服務(wù)。
康知網(wǎng)CEO、祥云醫(yī)療集團(tuán)副總裁胡翼即講到了醫(yī)療行業(yè)在運(yùn)用百度大腦過(guò)程中的成果。通過(guò)百度大腦的圖像識(shí)別技術(shù)來(lái)快速識(shí)別出是那種疾病,降低患者因不知何種疾病而導(dǎo)致的風(fēng)險(xiǎn),提高醫(yī)患交流的效率。之后百度大腦給予個(gè)性化推薦,幫助醫(yī)生提供更佳的診療方案。
感知世界的基礎(chǔ)之強(qiáng)大的數(shù)據(jù)處理能力
能夠做到感知世界服務(wù)于各行各業(yè)的基礎(chǔ)是具有強(qiáng)大的數(shù)據(jù)處理能力。百度大數(shù)據(jù)部的副總監(jiān)高亮即講到了百度大數(shù)據(jù)處理能力的三層架構(gòu),海量數(shù)據(jù)存儲(chǔ)能力、智能分析能力和基此之上做出的大數(shù)據(jù)產(chǎn)品。
海量數(shù)據(jù)存儲(chǔ)首先要解決的就是數(shù)據(jù)的傳輸。百度推出的海量數(shù)據(jù)存儲(chǔ)產(chǎn)品——通用數(shù)據(jù)倉(cāng)庫(kù)能夠?qū)⑷魏我粋€(gè)產(chǎn)品線的數(shù)據(jù)實(shí)時(shí)的傳送到數(shù)據(jù)倉(cāng)庫(kù)里,同時(shí)能夠解決數(shù)據(jù)存儲(chǔ)的另一大問(wèn)題即數(shù)據(jù)的標(biāo)準(zhǔn)化。無(wú)論數(shù)據(jù)是什么樣的格式到了這個(gè)數(shù)據(jù)倉(cāng)庫(kù)里都能以同樣的格式來(lái)存儲(chǔ)。
做到存儲(chǔ)之后接下來(lái)就是進(jìn)行各種各樣的處理。事實(shí)上百度已經(jīng)形成了一個(gè)數(shù)據(jù)的生命周期,值得注意的是這個(gè)周期是全自動(dòng)化的,從數(shù)據(jù)的生成,數(shù)據(jù)的傳輸,數(shù)據(jù)的標(biāo)準(zhǔn)化,數(shù)據(jù)的歸類(lèi)再到數(shù)據(jù)的分析,都是一個(gè)自動(dòng)化的過(guò)程。而且對(duì)于這套自動(dòng)化的流程,百度已經(jīng)形成了自己的產(chǎn)品——Query Engine。
Query Engine能夠做到無(wú)論數(shù)據(jù)是什么樣的都能進(jìn)行標(biāo)準(zhǔn)化處理,當(dāng)數(shù)據(jù)實(shí)時(shí)生成時(shí)通過(guò)其良好的數(shù)據(jù)傳輸架構(gòu)保證將數(shù)據(jù)上傳到百度的開(kāi)放云中,在上面進(jìn)行建模,進(jìn)行各種各樣的可視化分析和決策過(guò)程。
到了大數(shù)據(jù)處理能力的第三層,百度推出了三大數(shù)據(jù)產(chǎn)品以服務(wù)于各行各業(yè)。百度司南,能夠讓企業(yè)對(duì)自身品牌有更客觀的了解。讓企業(yè)知道自己的品牌在同行業(yè)中的定位是怎樣的,了解自己的忠實(shí)客戶(hù)還關(guān)心什么,了解客戶(hù)是通過(guò)什么渠道來(lái)了解自己的品牌。另一個(gè)產(chǎn)品是預(yù)測(cè)平臺(tái)產(chǎn)品,幫企業(yè)預(yù)測(cè)未來(lái)的營(yíng)業(yè)額,或幫政府預(yù)測(cè)某地的交通人流量。在一個(gè)產(chǎn)品就是百度推薦,行業(yè)可以定制百度推薦的哪一方面的性能、技術(shù)和功能。
感知世界的基礎(chǔ)之深度學(xué)習(xí)
百度大腦所具有的各種分析能力技術(shù)都有一個(gè)重要的基礎(chǔ)即深度學(xué)習(xí)。深度學(xué)習(xí)就是在最大程度上模擬人腦神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和行為。百度研究院副院長(zhǎng)余凱講到百度正在構(gòu)建世界上最大的深度神經(jīng)網(wǎng)絡(luò),達(dá)到百億級(jí)參數(shù)。通過(guò)開(kāi)發(fā)的各種不同的深度學(xué)習(xí)模型應(yīng)用于圖像、語(yǔ)音識(shí)別,搜索,和廣告推薦等技術(shù)。
當(dāng)人們?cè)诎俣绕脚_(tái)上表達(dá)搜索需求,百度大腦要識(shí)別用戶(hù)的意圖,在精確識(shí)別用戶(hù)搜索意圖后,用深度學(xué)習(xí)來(lái)對(duì)網(wǎng)頁(yè)語(yǔ)義進(jìn)行相關(guān)性排序,從而匹配用戶(hù)需求,這就完成了人與信息的連接。另一方面連接人與廣告和服務(wù),通過(guò)大規(guī)模的深度學(xué)習(xí),去估計(jì)和優(yōu)化點(diǎn)擊率和轉(zhuǎn)化率,進(jìn)而把人連接到所需要的廣告和服務(wù)。深度學(xué)習(xí)已經(jīng)應(yīng)用在百度核心業(yè)務(wù)的方方面面,真正實(shí)現(xiàn)智能連接人和信息,智能連接人和服務(wù)。
百度大腦里用到一種叫深度語(yǔ)義神經(jīng)網(wǎng)絡(luò)的模型,這是百度大腦用于自然語(yǔ)言,去匹配query和網(wǎng)頁(yè)的語(yǔ)義相關(guān)性,是業(yè)界第一次把深度學(xué)習(xí)用于提升搜索精度的成功案例,也是迄今為止深度學(xué)習(xí)用于語(yǔ)音文本信息最成功的應(yīng)用。
基于深度學(xué)習(xí)的OCR技術(shù),可以像人一樣讀懂文字。如一個(gè)外國(guó)人在上海看到某個(gè)菜單,他想知道這個(gè)菜單中是否滿足他想要的菜品需求,但自己又不懂中文不知道這是什么菜。他可給中文字拍照用百度翻譯,百度通過(guò)識(shí)別中文知道這是什么菜,通過(guò)識(shí)別后再翻譯成英文并有語(yǔ)音合成。這體現(xiàn)了百度在方方面面的人工智能領(lǐng)域有很深的積累。
將感知世界開(kāi)放給行業(yè)——開(kāi)放云
百度具有諸多的先進(jìn)技術(shù)和產(chǎn)品,于此同時(shí)百度還推出了開(kāi)放云平臺(tái)。百度基礎(chǔ)架構(gòu)部高級(jí)總監(jiān)楊煬講到,百度開(kāi)放云是希望幫助客戶(hù)提供云開(kāi)放的投入,客戶(hù)只需要按一下按鈕,就可以獲得百度云,而且是誰(shuí)用誰(shuí)付費(fèi),成本很低。另外在云上面提供非常多的服務(wù),用戶(hù)可以像搭積木一樣搭建起來(lái),更重要的是后面有百度專(zhuān)業(yè)人員幫客戶(hù)運(yùn)維,還能給客戶(hù)提供完整的解決方案,幫助客戶(hù)在競(jìng)爭(zhēng)中獲得更大的優(yōu)勢(shì)。
開(kāi)放云能夠與大數(shù)據(jù)結(jié)合,因?yàn)闊o(wú)論什么業(yè)務(wù)都有大量的數(shù)據(jù)存儲(chǔ),將這些數(shù)據(jù)存儲(chǔ)放到開(kāi)放云里面。同時(shí)將很多數(shù)據(jù)處理和流程都放到云上,就可以讓數(shù)據(jù)存儲(chǔ)更容易,把數(shù)據(jù)存儲(chǔ)變成結(jié)果的應(yīng)用也更容易。
百度未來(lái)還將開(kāi)放云引擎,開(kāi)放SaaS(軟件即服務(wù)),開(kāi)放IaaS(基礎(chǔ)設(shè)施即服務(wù))。因?yàn)楹芏嗥髽I(yè)需要的不僅僅是高大上的東西,需要的是完整的IT解決方案,這個(gè)解決方案既包括上層的服務(wù)應(yīng)用,又包括基本的網(wǎng)絡(luò)存儲(chǔ)服務(wù)。未來(lái)百度要借助開(kāi)放平臺(tái)為客戶(hù)提供一個(gè)完整的從端到端的解決方案。