但是,機遇的背面一定非常讓人難以接受。很多專家其實早就表示,我們離人工智能還差得很遠。現在的AI,充其量只能算作是一個用人工處理的“人工智能”。
人工智能背后的數據農民工
根據理論和各家的宣傳材料,人工智能的相關技術,就是用計算機編程和算法來自動解決遇到的各種問題。但實際上,算法并不能完全解決人工智能在實際應用中遇到的各種問題。有相關媒體報道表示,以自動駕駛來說,單純靠算法,車輛上路百分百會出事故,算法能解決的交通實際問題只有不到40%。
那為了實現最起碼看起來像回事的智能駕駛,就需要開發團隊用窮舉法,列出可能在開車時遇到的問題。而其中最重要的就是自動駕駛如何識別斑馬線,為了做到這一點,就必須提供大量標注了斑馬線的數據來進行學習,數據量足夠大時,機器就可以識別出任何角度的斑馬線。而做這種事情,在行業中有一個專有名詞,叫做數據標注。
自動駕駛遇到問題解決方式需要數據標注;智能音箱解決使用者常用狀態需要數據標注;高德地圖解決語音識別和道路選擇需要數據標注……
在某種程度上,AI算法的優化,取決于數據標注的質量,而把控這些質量的,是完全不懂AI技術的一群人。
這群人沒有技術含量,只要求會使用計算機、細心即可。入行很簡單,因此也有公司專門招聘殘疾人來做這個工作。由于連編程都不用,就是在不停的回答問題或者輸入自己覺得正確的解決方案,他們被稱作人工智能領域的“農民工”。
各大AI公司的人工團隊
現在對于各家AI領域的獨角獸公司來說,數據標注根本不是新聞,組建專門的團隊也是常態。更有甚者,已經出現數據標注的外包公司。
據財經雜志報道,在鄭州有專門的產業園,入住的公司看名字都很高大上,很多都是人工智能公司,但實際上公司就像個大網吧,都是簡單進行數據標注的。有的公司因為跟BAT有協議,因此能龐大到幾百人的團隊,有時候“活緊”,還會通宵加班。
而據相關行業人士表示,這個行業盈利情況不錯。一個成熟的標注員,月產值能做到7000元,除去3000元的工資和質檢、場地設備等費用,公司能賺1500元。
但因為在行業底層,其實這些企業并沒有得到很多的機會。在中國政府大力支持AI產業發展的政策環境之下,不少地方政府都通過各項優惠政策,吸引AI公司落戶,但數據標注行業似乎是一塊被忽視的死角。
最笨的方法卻成捷徑
提及人工智能,所有人腦子里都是高大上的影子。但實際上,我們整個行業卻是建立在一個最笨的“窮舉法”之上。
現在所謂的人工智能,只不過是在窮盡的解決方案中拼湊出一個還不錯的去實施,一旦遇到例外,這次肯定不行,后臺數據標注團隊將解決辦法標注后,下次就補上這個窟窿。
可真正的自我學習、自我分析的人工智能,仍然是鏡中月水中花。
沒有人工,就沒有智能,現在是行業常態。這種糊弄人糊弄事的所謂AI技術,遍地開花之后,留下的只能是無盡的悲哀。而浮躁的行業,也容不下耐心發展真正人工智能的企業。畢竟用數據標注,1年產品就能上市,投資方能看到效益。而真正的人工智能,可能需要很多年的摸索也未竟功成。
好消息是華為于10月10日發布AI戰略,華為輪值董事長徐直軍在臺上提到,數據標注師這樣的職業很有可能被顛覆,華為要做的改變是提升AI自身的自動化水平,比如在數據標注、數據獲取、特征提取、模型設計和訓練等環節實現自動化或半自動化。
也許,這將是AI真正擺脫人工的開始,但愿我們能早日享受到真正的人工智能。