人工智能將發展成什么樣,未來大家逛街是否都會帶一臺機器人隨行,變形金剛會滿地跑嗎?人工智能設備能夠幫助人類,但人類是否被其所控?
按照阿里巴巴馬云的話來說,未來機器人會比人類更強大,但不會比人類更明智,人的智慧是人類的核心,機器對友情和愛沒有感覺,所以要用機器來作為創新的解決方式。
但《澳門風云3》電影讓人思考,未來機器人也可能會擁有人類的情感。
中國的智能硬件,手機、電視等產品每個月都在推出擁有新科技、新功能的產品,快速發展的智能硬件已經在準備迎接智能時代的到來。
阿爾法狗戰勝李世石讓人工智能的討論熱潮席卷了IT界,近期涌現了多家交互對話機器人等類別的創業公司,股權投資機構也在對人工智能領域熱切下單投資。
未來尚不可知,人工智能現在和近期能夠影響人類生活的還主要在這樣幾個領域——語音語言識別、圖片識別和自動駕駛。
實際上,人工智能還是一件大難事,比如讓機器像人一樣聽得懂語言就是一件難事,而聽得懂,還能流暢回答交流,甚至能夠根據你的語氣、面部表情體會到你的情感,讓其組織語言來跟你交流,就是更難的事情了。
語音識別、圖片識別、自動駕駛的現狀與挑戰
去年的百度世界大會介紹了多款業務和產品,李彥宏親自介紹的是百度的語音搜索產品度秘,李彥宏用了幾段方言來測試度秘的語音分析能力,現場的許多觀眾都沒有聽懂那句話,但度秘卻輕松聽懂了。度秘這款產品,可以為百度糯米等產品提供語音文字輸入,能夠用來購買產品、尋找地址,還與華為榮耀手機“智靈鍵”深度集成,為華為手機用戶提供秘書化搜索服務。
按照李彥宏的邏輯,在移動互聯網觸屏時代,80后之前的人可能還愿意打字交流,但90后甚至00后,可能更愿意和習慣用語音來與智能設備交互。所以度秘是百度方便用戶使用并引領用戶習慣變遷的重要產品。
如果不懂人工智能開發的繁雜和困難,會覺得讓機器聽懂一個人說話有那么難嗎?其實這個過程非常復雜。實際上,百度、谷歌、阿里巴巴等公司至今也沒有在語音識別這個領域做的盡善盡美。比如對方言和嘈雜環境中的語音識別,差錯率也還是有一些的。
目前,度秘等產品承擔的主要還是聽懂的功能,而微軟小冰等交互機器人產品,則進一步在承擔人機交流對話的功能。小冰現在用戶眾多,微軟對小冰機器人寄予厚望,認為是其移動互聯網的重要入口。
人工智能的應用,還體現在電商圖片搜索領域。此前傳統的搜索方式主要是通過品牌貨號進行文字搜索。現在,用戶上傳一張服裝的圖片即可以在淘寶搜索出多個類似款式的衣服。
之所以能夠搜出來,是因為淘寶對大量的服裝進行了標注,比如該衣服是長款還是短款,什么顏色,帶領還是無領等,但由于目前標注點還比較少,所以給出的搜索結果是多款類似的衣服,用戶可以在其中找尋合適的款式,或在給出的結果中再自行搜索那個同品牌同款式的衣服。
想要通過圖片搜索直接找到同品牌同款式服裝,需要成倍增加標注點,成本大幅上升,對淘寶來說未必劃算。但據說目前已經有了擁有圖片精確搜索技術的公司,相信隨著人工智能的迭代發展,通過圖片搜索服裝、鞋子、包包、家具等產品都將更加直接和容易。
此外,自動駕駛也是人工智能領域最前端的技術。目前,包括百度、谷歌在內的公司,都在積極研發之中,但完全商業化,需要假以時日。自動駕駛面臨更多更繁雜的數據,包括與其他車輛的距離、車速、變道時機、剎車幅度、避讓行人、天氣、行駛路線等各種因素,其對大數據的需求量更大。
大數據應數量與質量并重,上下游公司協同配合
上述的語音識別、圖片識別和自動駕駛等人工智能的應用,都需要基礎數據作為支撐。度秘和微軟小冰,需要提前為其輸入大量語料,其再根據語料來構建算法和模型,并對其進行持續訓練和持續提供最新熱點語料,才能制造出一個跟得上時代的交互機器人。
而由于地域廣闊,方言繁多,方言采集清洗就是一個巨大的挑戰。對于微軟小冰來說,要為其設定合適的年齡、性別和性格,這也需要為其提供適合其身份的語料。
博彥科技的基礎數據處理團隊及數據工程師團隊一直持續在為微軟小冰、百度度秘提供語料與機器訓練服務。博彥科技與BAT、微軟、谷歌等企業保持著多年的基礎數據業務合作。
大數據是人工智能發展的基礎,在大數據與人工智能的發展征途中,需要上下游各家公司的協同配合。大數據的設計算法和數據處理都需要大量的人工服務,有多少人工就能產生多少智能。大數據的質量和數量,影響著人工智能呈現效果。
在語音和圖片識別領域,博彥科技擁有超過400人的全職自有團隊,十余年的大數據服務經驗,投入了大量科技研發力量以增強算法和數據服務,建立了完備的數據質量保障體系。
博彥科技副總裁孫鐵林表示,中國人工智能的發展,也需要有扎實的大數據基礎,需要進行大量的人力和資金投入。數據數量與質量都非常重要,如果只看重數量,而不看重質量,人工智能產品最終呈現的效果會受到很大影響。目前,google、微軟等世界巨頭科技企業,每年都會在人工智能領域投入大量預算用于提高數據數量與質量。
大數據的進一步應用,掘金1.6萬億美元市場
幾十年前各國IT部門就已經在花力氣研究人工智能,但因為當時的信息傳輸能力、計算能力有限,所以人工智能的發展和應用一直不溫不火。但現在人工智能在各個領域迅速發展。未來用戶看到的籃球比賽的精彩回放,可能就是來自于機器的自動抓取回放。一些創業公司也在力爭讓機器看得懂人類喜怒哀樂的表情,在嬰兒的啼哭聲音中發現其啼哭的原因。
根據戴爾公司總裁邁克爾·戴爾提供的數據,今天我們的處理能力、帶寬、存儲正以每年10倍的速度成倍增長,而未來15年我們的技術將會比現在更強大1000倍。今天破解一個人類基因組需要16個小時,2031年將只需要一秒。每一個新生兒在醫院都將有個性化的醫療,電腦的處理能力將超過人腦,且成本將不到1美元。
現在一些智能手機、電視、無人機和其他基礎設施都在連上互聯網成為物聯網的一部分,這會進一步催生數據中心和數據運營商的發展。云計算、大數據、人工智能是緊密關聯的數字化變動動力。
在日前剛閉幕的中國第二屆大數據產業峰會上,微軟全球執行副總裁陸奇認為,如果能夠善用大數據,全球企業將額外獲得1.6萬億美元的數字紅利,而中國將占據其中可觀的份額。但數據只有經過精雕細琢才能體現真正的價值,未來在高級分析、機器學習、神經網絡等領域,需要積累和發展先進的技術和經驗,將其中的內涵和關聯轉化為智能硬件更適合使用的產品。
未來,大數據將廣泛應用于電商等各個領域。比如目前中國的企業庫存就有十幾萬億,如果通過大數據減少庫存甚至成為零庫存,則將節省巨大的資源、產生巨大的價值。未來汽車零件磨損或發生交通事故,新的零件會及時自動生成訂單,以便及時為車輛進行更換。
現在,已經發展出來能夠模擬人腦的大型神經網絡系統,在摩根定律的進化下,人類已經有了前所未有的計算能力。人工智能還發展出各種深度學習算法,機器可以利用大數據不斷學習人類的智能行為,替代人類完成簡單的體力甚至腦力勞動。
下一次的產業技術革命將建立在大數據基礎上的人工智能技術上,中國有望成為全球領先的人工智能技術國家。現在,掘金其中正當時。