精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

百度的深度學習戰(zhàn)略:是噱頭還是價值的確立?

責任編輯:editor04

2014-11-01 18:59:05

摘自:虎嗅網(wǎng)

昨天(10月30日),百度舉行了一次小規(guī)模的媒體開放日活動,介紹了其深度學習在最新的拍照搜索方面的應用成就。這個技術從8月20日開始,已經(jīng)部署在手機百度5.5版本上。

昨天(10月30日),百度舉行了一次小規(guī)模的媒體開放日活動,介紹了其深度學習在最新的拍照搜索方面的應用成就。這個技術從8月20日開始,已經(jīng)部署在手機百度5.5版本上。

自2013年百度公布深度學習戰(zhàn)略以來,通過媒體的持續(xù)跟進,深度學習的一些現(xiàn)實應用已經(jīng)廣為人知。例如最普及的拍照搜索,與其他一些互聯(lián)網(wǎng)公司僅能識別簡單的書籍、CD封面不同,百度已經(jīng)可以識別并檢索人臉、植物、水果等形狀不規(guī)則、顏色復雜、規(guī)律性不強的圖像。一個應用實例是,用戶對皮膚病患者的患病部位拍照并進行搜索,百度通過與數(shù)據(jù)庫中的標準案例比對,能夠告訴患者病情的嚴重程度,并給出對應醫(yī)院、醫(yī)生的就診建議。據(jù)百度高級副總裁王勁透露,目前,這一拍照預診產(chǎn)品的成功率已經(jīng)達到93%。

但是,由于深度學習技術涉及到大量高深的數(shù)學技術和復雜的算法原理,目前在大眾領域,對其的認知仍然比較零散,還停留在兩端:在原理端,知道這是一種很先進的計算機技術;在實用端,知道有語音識別、圖像搜索等實際用途。但深度學習對現(xiàn)有的計算機應用有怎樣的革命性,以及這些實用技術具有怎樣的商業(yè)價值,卻不甚了然。

淼叔自去年6月在國內(nèi)首度報道深度學習在互聯(lián)網(wǎng)領域的應用后,一直在關注這個領域的發(fā)展,并結合《數(shù)學之美》等經(jīng)典的數(shù)學-互聯(lián)網(wǎng)-商業(yè)領域的普及書籍,試著把上面兩個問題解答一下,并結合百度剛發(fā)布的第三季度財報,看看這個領域的商業(yè)價值。

深度學習的價值在于"自動化" 計算機出現(xiàn)對于人類最大的意義,是可以把大量重復勞動快速完成,因為論簡單的運算能力,計算機的效率早就可以達到人類的數(shù)億倍。反推過去,如果要讓計算機解決什么問題,就先要把這個問題轉(zhuǎn)化為可以簡單計算的內(nèi)容(計算次數(shù)可以充分巨大,反正能力強)。再往前推一步,一個領域的"可簡單計算化",決定了它的"計算機處理化"程度也就是自動化程度,也就決定了它大規(guī)模發(fā)展的程度。

以文字內(nèi)容為例。早期在互聯(lián)網(wǎng)上,人們需要人工識別網(wǎng)頁的內(nèi)容,并以此分類,提供給用戶搜索。這樣效率就很低,在網(wǎng)頁數(shù)量高速增長后,搜索行業(yè)就拖了后腿。在TF-IDF算法出現(xiàn)后,計算機可以自動提取一篇文章內(nèi)容的關鍵字,網(wǎng)頁的歸類實現(xiàn)了自動化,再配合上Google發(fā)明的Page Rank算法,使網(wǎng)頁的優(yōu)先排序也自動化了,整個文字世界被成功數(shù)字化,這才有了互聯(lián)網(wǎng)對媒體行業(yè)的顛覆性大發(fā)展。同時,IDF算法能成功識別出網(wǎng)頁的關鍵內(nèi)容,使搜索引擎可以為它匹配上高度相關的廣告,實現(xiàn)了商業(yè)鏈條的閉環(huán)。

但是,文字只是人類世界的一小部分。在可感知的領域中,聲音、圖像都占據(jù)有更大的數(shù)據(jù)量,也是更為直觀、人口基數(shù)更大的信息交流方式。目前,在這個領域,像手工給文字網(wǎng)頁分類一樣,人們依然使用人工分類的方式進行信息索引、查找與再利用。這實際上是把聲音、圖像都先文字化,而文字內(nèi)容已經(jīng)互聯(lián)網(wǎng)化,所以才能用互聯(lián)網(wǎng)的方式處理那些多媒體內(nèi)容。

這里的"人工分類",粗略地說,在大數(shù)據(jù)領域,就相當于"打標簽",用文字標注出多媒體內(nèi)容的屬性。我們一開始就說了,整個鏈條中只要涉及人工,效率必然被拖后腿。這也是大數(shù)據(jù)領域現(xiàn)在的難題,因為總少不了人工打標簽這個環(huán)節(jié)。

說到這里就可以看出深度學習的重要意義了:深度學習的最大特點,就是把一個復雜的認知問題分解為幾層簡單問題,通過對簡單問題的大運算量處理,得出規(guī)律,進入下一"層",逐層運算處理,直到觸達事物本質(zhì)。舉個比較粗略的例子,在人工分類時,對于一朵花,人們需要手工打上一些標簽:粉紅色,分為六個均等的部分(花瓣),中間有柱狀蕊,常與綠色一起出現(xiàn),等等。當輸入一張花的圖片時,計算機與這幾個標簽比對,都對上了,就輸出結果:這是一朵花。商業(yè)價值拓展則是配上廣告,哪里可以買到花,買到花盆,買到養(yǎng)花的書,找到跟你一樣喜歡養(yǎng)花的單身女性,等等。

整個過程的短板在人工打標簽的階段。而在深度學習層面,它不需要人類去打標簽,只要給它輸入一百萬張花的圖片,它會自動逐層尋找共同特征,歸納出標簽,最后再去跟同類圖片比對,驗證這些標簽,完成認識過程。有人可能說你這100萬張圖片還不是要人工拍攝、輸入?那倒還真未必,拿一個攝像頭對準一盆花自動拍不就得了,如果想增加點全面性,那就把花盆放在自動旋轉(zhuǎn)臺上,旁邊再放個電風扇讓它搖曳多姿,這樣可以保證系統(tǒng)獲得盡量多樣化的圖片。

移動時代的價值確立

所以我們回到百度的案例來,就可以看到深度學習的巨大商業(yè)價值。它解決了搜索引擎在處理多媒體信息方面的弱項,把他們轉(zhuǎn)化為已經(jīng)具有成熟技術和商業(yè)模式的文字信息。同時,由于多媒體信息相對于文字信息在數(shù)量級上的龐大,這部分的商業(yè)真空也同樣巨大。更為重要的是,文字搜索更多的是一種PC時代的習慣,移動互聯(lián)網(wǎng)時代,由于文字輸入的瓶頸和手機拍攝/語音功能的完善,語音、圖片搜索的比例將大幅度提升甚至成為主流。根據(jù)李彥宏披露,百度現(xiàn)在已經(jīng)有10%的搜索請求來自于語音,而未來五年內(nèi),語音、圖像搜索將驅(qū)動一半以上的搜索請求。

這也是百度重兵投入深度學習的戰(zhàn)略意圖。打仗的根本要訣是要在熟悉的戰(zhàn)場、以擅長的戰(zhàn)術決戰(zhàn);而深度學習可以把世間萬物近似全自動地數(shù)字化為百度已經(jīng)建立的文字搜索模式,又使使用場景和商業(yè)空間數(shù)以百倍計地增長,而需要的又是百度最為擅長的技術研發(fā)能力,所以當然要全力以赴。同時,深度學習又是一個需要大量技術積累的領域,這使得它成為百度移動互聯(lián)網(wǎng)時代最可依賴的技術門檻。

在三季報發(fā)布前一個月上線拍照搜索、三季報發(fā)布日附近又將手機百度升級到更強化拍照搜索和身邊商務的6.0版,都是為了強化百度以深度學習技術驅(qū)動的移動互聯(lián)網(wǎng)戰(zhàn)略。而在本年第三季度中,百度首度出現(xiàn)了移動流量超越PC流量的現(xiàn)象,移動營收在總營收中占比也達到了創(chuàng)紀錄的36%。這種增長,不僅僅是PC端流量的簡單遷移,而是語音、圖像搜索等更具移動特色的搜索需求開拓出了新的場景,也帶來了新的變現(xiàn)途徑。所以,除了移動流量和營收比例增長外,百度總營收也同比增加了52%。

對于移動互聯(lián)網(wǎng),越來越主流的聲音認為,它不是桌面互聯(lián)網(wǎng)的繼續(xù)延伸,而是平級于互聯(lián)網(wǎng)革命的又一場革命。僅僅在信息處理領域,我們已經(jīng)看到語音、圖像對于文字的顛覆,也看到了成熟商業(yè)模式的曙光。而驅(qū)動這一切發(fā)生的,依然是生生不息的技術創(chuàng)新。

鏈接已復制,快去分享吧

企業(yè)網(wǎng)版權所有?2010-2025 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號

  • <menuitem id="jw4sk"></menuitem>

    1. <form id="jw4sk"><tbody id="jw4sk"><dfn id="jw4sk"></dfn></tbody></form>
      主站蜘蛛池模板: 伊春市| 巴楚县| 延边| 兴和县| 定日县| 射阳县| 康定县| 康马县| 龙里县| 修武县| 青浦区| 绿春县| 沂水县| 鸡西市| 道孚县| 张家口市| 赫章县| 肃北| 汾阳市| 东乌珠穆沁旗| 西畴县| 商洛市| 曲周县| 禹城市| 枞阳县| 南通市| 富裕县| 同江市| 仙游县| 昆山市| 温泉县| 神农架林区| 乐平市| 青铜峡市| 义马市| 普安县| 汉阴县| 叶城县| 蓝田县| 乐业县| 东方市|