ZDNet>軟件頻道>互聯網>
郵件訂閱訂閱:
百度世界再打人工智能牌 好萊塢大片已嗅到先機
摘要:今年人工智能題材的好萊塢大片層出不窮,從萬眾期待的《復仇者聯盟2:奧創紀元》,到火爆動作的《超能查派》,再到發人深思的《她》、《機械姬》,好萊塢的導演們似乎一窩蜂的選擇了“人工智能”這個題材。
作者:來源:ZD至頂網軟件頻道 | 2015年09月09日 18:26:18
ZD至頂網軟件頻道消息: 今年人工智能題材的好萊塢大片層出不窮,從萬眾期待的《復仇者聯盟2:奧創紀元》,到火爆動作的《超能查派》,再到發人深思的《她》、《機械姬》,好萊塢的導演們似乎一窩蜂的選擇了“人工智能”這個題材。正如1968年的《2001太空漫游》一般,電影行業敏感的捕捉到了新科技引爆的火花,對于人工智能這樣的創新科技的發展,他們樂于做出各式各樣的預測。我們不難看到,與十多年前的該題材電影相比,2015年的人工智能電影距離夢想更遠,距離現實更近,每一部的大片中我們似乎都看到了當下的影子。這其中的原因很大程度上來自于各大科技巨頭對于人工智能的探索,以及取得的巨大成就。
百度就是其中重要的一員。百度近兩年來絲毫不掩飾他們在人工智能領域上的野心。3月份李彥宏在兩會提出的中國大腦提案宣誓了他們希望用人工智能改造未來的雄心,在今天的百度世界大會上,這個未來似乎離我們更近了。百度技術高級副總裁王勁在他的主題演講中讓我們更加切實的感受到了中國大腦的力量,一款名為“DuLight(小明)”的設備引起了我們的興趣。這款專為盲人設計的可穿戴設備,依托于百度的人工智能技術,實現了實時的圖像畫面識別,并且能夠將識別的結果用語音的方式反饋給用戶。
這樣的產品,不由讓我們想到了《她》中的人工智能操作系統,類似的人機交互、類似的硬件設備,未來在我們眼前觸手可及。
DuLight的底層邏輯非常簡單:用攝像頭捕捉畫面,并且將畫面用語音表達給視覺不便的用戶。實現這點最簡單的辦法就是讓一個工作人員坐在顯示屏面前,不斷的看到捕捉的畫面,不斷的給出語音反饋。百度確實也是這么做的,只不過這名“工作人員”并不是真人,而是強悍的“百度大腦”,強悍的人工智能。
當我們細細剖析DuLight背后的技術,其中的兩項圖像視覺技術躍入眼簾——圖像識別與人臉識別。這兩項技術不僅是DuLight的基石,也是未來成就中國大腦的基石技術。
圖像識別:“聽說”這個世界
圖像是一種典型的非結構化數據形態。長期以來,電腦都很難像人腦一樣去識別圖像其中的內在語意關系,并轉化成為自然語言,與人類形成互動。
圖像識別技術正是通過電腦辨識圖像內容并提取語義信息的過程,典型的任務包括物體識別、物體檢測、圖像分類標注等,在圖像類數據的智能化分析管理中扮演著至關重要的角色。百度通過長期的努力,已經構筑了一套比較完整的圖像識別系統,能夠有效地處理特定物體的檢測識別(如人臉、文字或是商品)、通用圖像的分類標注、以及主觀圖像質量評估等問題。
基于圖像識別技術,各類的應用場景應運而生,比如李彥宏在此前TechWorld上展示的圖文問答(Image QA)。相比較于圖片描述(Image Caption)的技術來講,既需要滿足針對圖片內容,生成自然的結果這個要求。在此基礎之上,不僅需要對于圖片進行足夠強的語義級別的特征提取,同時還要求計算機能夠理解問題用戶的問題,并根據用戶所提出的問題,從圖像中提取相關的信息進行自然的回答。只有在圖像理解、語言理解、語言的生成上都做到比較好的程度,才能完成相關的技術。
人臉識別:更加精細化的識別場景
人與人之間大量的互動讓人臉識別成為了最為實用的圖像識別細分領域。相比于無領域限制的圖像識別,聚焦在人臉上的識別技術顯然能夠做到更加精準與高效。百度現有的人臉識別技術已經具備了很強的識別用戶的能力,這項技術可以分辨用戶的性別、年齡等特征,并且區分不同的用戶。
百度的人臉識別技術,從檢測到識別,都采用了統一的端到端深度學習框架,完全代替了傳統算法,配以海量數據和強大的計算能力,訓練出效果遠超傳統的算法和模型,同時還可以根據不同場景的人臉數據做快速的迭代和優化。據悉,在全球最具權威的人臉檢測評測平臺FDDB公布的最新數據中,百度獲得人臉檢測公開數據集評測第一名;在世界最權威人臉識別評測 (LFW) 中,百度獲得人臉識別公開數據集評測第一名的佳績。
人臉識別技術在DuLight中得到了很好的應用,用戶可以把自己的親朋好友臉型錄入系統,而當這名好友出現在用戶面前,被DuLight的攝像頭所捕捉到,系統可以精準的識別用戶的身份,并用語音方式反饋給用戶。而對于系統中不存在的陌生人臉,利用人臉識別技術,用戶也可以得到一個非常詳盡的反饋,將面前人物的性別、年齡等信息反饋給用戶。對于盲人用戶而言,這是一個從0到1的重大突破,原來黑漆漆的世界,出現了一絲光亮,原來幾乎無法感知的世界,可以被聽見,可以被感受到,通過DuLight點亮他們的精彩世界。
技術讓互聯網+更加清晰
圖像識別與人臉識別技術的出現與不斷成熟,讓我們對于未來有了更多的暢想,一些科幻電影的場景也許會逐漸成為我們生活中會司空見慣的場景。比如,銀行卡將不需要再驗證數字密碼,而是直接采用“刷臉”的方式驗證用戶身份,不僅更加方便,而且安全可靠。
據了解,百度已經陸續有了開放這些基礎技術的計劃,在百度開放云平臺上,我們已經欣喜的看到百度開放到圖片識別服務,傳統行業可以快捷的接入圖像識別接口,實現多張人臉圖片相似度比對,移動端的人臉注冊、驗證登錄等功能。后續,人臉檢測、關鍵點、人臉屬性等更基礎的人臉服務也會集成到百度開放云的API中,成為開放云的基礎服務之一。
通過技術,互聯網+變得更加清晰與真實,傳統行業轉型互聯網有了充足的彈藥支撐,我們有理由去暢想一個美好的未來。