院子里,侯夏夢經(jīng)營著一家?guī)椭斯ぶ悄芾斫馐澜绲墓尽?4個年輕人在瀏覽照片和視頻,標記他們看到的每樣東西。這是一輛汽車,那是一個紅綠燈。這是面包,這是牛奶,那是巧克力。這是一個人走路的樣子。
“我以前覺得機器很聰明,”24歲的侯夏夢說,“現(xiàn)在我知道,它所有的聰明都是我們給它的。”
在長期充當世界工廠的中國,新一代的低薪工人正在為未來奠定基礎。在規(guī)模較小、成本較低的城市,創(chuàng)業(yè)公司如雨后春筍般涌現(xiàn),他們在給中國海量的圖像和監(jiān)控錄像添加標簽。正如一位專家所說,如果把中國比做數(shù)據(jù)方面的沙特阿拉伯,那么這些公司就是煉油廠,它們將原始數(shù)據(jù)轉化為可以為中國的人工智能雄心提供動力的燃料。
通常認為中國和美國正在爭奪人工智能的霸主地位,而中國具有一定的優(yōu)勢。中國政府在財政和政策上廣泛支持人工智能公司。2017年,全球計算機視覺市場中,中國創(chuàng)業(yè)公司占了三分之一,超過美國。中國的學術論文在研究論文中被引用的頻率更高了。在去年的一份重要政策聲明中,中國政府表示,預計到2030年,該國將成為人工智能領域的全球領導者。
更重要的是,這種想法認為,多虧了薄弱的隱私法律及其執(zhí)行,中國政府和公司獲得了堆積如山的數(shù)據(jù)。在Facebook、谷歌和亞馬遜已經(jīng)積累的數(shù)據(jù)之外,中國互聯(lián)網(wǎng)公司能獲得更多,因為那里的人們太常用他們的手機購物、支付餐費,以及購買電影票。
然而這些說法中的許多是存疑的。中國的論文和專利可能存在問題。政府的錢可能會被浪費掉。目前還不清楚人工智能競賽是否會是一場贏者通吃的零和博弈。除非有人能夠分析和歸類,否則數(shù)據(jù)是無用的。
但標記這些數(shù)據(jù)的能力,可能是中國真正的人工智能實力,也可能是美國唯一無法匹敵的力量。在中國,這個新興產(chǎn)業(yè)提供了一個政府長期承諾的未來的一瞥:一個建立在科技而非制造業(yè)基礎上的經(jīng)濟。
“我們這些人屬于數(shù)據(jù)行業(yè)里的建筑工人。我們做的事就是壘磚頭,一塊一塊地壘,”中部省份河南郟縣一家數(shù)據(jù)標簽工廠的聯(lián)合創(chuàng)始人伊亞科說,“但我們在人工智能中扮演著重要角色,沒有我們,他們無法建造摩天大樓。”
雖然人工智能機器是超快的學習者,擅長處理復雜的運算,但它們缺乏就連5歲的孩子都具備的認知能力。小孩子們都知道棕色的可卡犬和黑色的大丹犬都是狗。它們可以分辨一輛福特皮卡和一輛大眾甲殼蟲,但還無法了解二者都是汽車。
人工智能需要被教導。它必須消化大量帶有標簽的照片和視頻,然后才能意識到,黑貓和白貓都是貓。這就是數(shù)據(jù)工廠及其工作人員起作用的地方。
標記幫助北京的人工智能公司AInnovation完善其為一家中國面包連鎖企業(yè)提供的自動收銀系統(tǒng)。用戶可以將糕點放在掃描儀下,在沒有人類幫助的情況下付費。但有三分之一的時候,由于商店照明和人體運動,圖像變得更加復雜,系統(tǒng)無法分辨瑪芬蛋糕、甜甜圈或叉燒包。AInnovation項目經(jīng)理梁睿表示,標記在使用商店內部照片的情況下,準確度高達99%。
“有多少人工就有多少智能,”梁睿說。
AInnovation有不到30個標記員,但標簽初創(chuàng)公司的激增使得把工作外包出去變得很容易。有一次,梁睿為超市做標簽,需要在三天內拍攝大約20000張照片。同事們在數(shù)據(jù)工廠的幫助下,只花幾千美元就完成了工作。
“我們就是10年前流水線上的工人,”河南那家數(shù)據(jù)工廠的聯(lián)合創(chuàng)始人伊亞科說。
數(shù)據(jù)工廠開始在遠離大城市的地區(qū)涌現(xiàn),通常是在相對偏遠的地區(qū),勞動力和辦公空間都很便宜。許多數(shù)據(jù)工廠的工人都曾在大城市的流水線和建筑工地工作。但是那些工作正在枯竭,工資增長放緩,而且許多中國人更喜歡住在離家較近的地方。
36歲的伊亞科失業(yè)后聽說了人工智能標記,那時他試圖和小學同學一起做別的公司。在網(wǎng)上搜索后,他認為這項工作技術性不強,只需要廉價勞動力,而這正是河南不缺少的。
三月,伊亞科和朋友們成立了睿金科技,該公司以每年2.1萬美元的價格在工業(yè)園區(qū)租用了兩個專業(yè)籃球場。它以前是園區(qū)黨委會的活動空間,吊頂燈上覆蓋著紅色的鐮刀錘子圖案。
睿金的意思是智慧黃金,它現(xiàn)在雇傭了300名工人,但計劃在春節(jié)假期后擴大到1000人,春節(jié)期間,很多農(nóng)民工會回家鄉(xiāng)。
與世界各地的工人和企業(yè)不同,伊亞科并不擔心人工智能會取代他的工作。
“機器還沒有聰明到自己教自己的程度,”他說。
招聘是一個更大的麻煩。
睿金每月400至500美元的薪酬高于郟縣的平均水平。一些潛在的求職者擔心自己對人工智能一無所知。也有人覺得這項工作很無聊。
19歲的靳煒祥表示,他將在春節(jié)后離開睿金,到南方城市廣州一家實體店賣家具。
“我喜歡和人打交道,”靳煒祥說。“做標注就是掙點錢。”
但對于一些以前的農(nóng)民工來說,這項工作比在流水線上工作要好。
“工廠里每天是一樣的活,一樣的動作,天天都一樣,”曾在一家電子元件公司工作的睿金員工、28歲的伊真真說。“現(xiàn)在得稍微動動腦子。”
大多數(shù)情況下,客戶不會告訴數(shù)據(jù)工廠,他們的工作是用來做什么的。有些是顯而易見的。比如標記交通信號燈、道路標志和行人,它們通常用于自動駕駛。標記許多類型的山茶花可能是給搜索引擎用的。
有一次,睿金得到一個任務,為數(shù)百萬個人類的口部圖像做標記。伊亞科說他不確定這是用來做什么的。也許是面部識別?
大約向北300英里的河北南宮市,侯夏夢經(jīng)營著一家數(shù)據(jù)工廠,由她婆家擁有的一間舊水泥廠改建而來。她在大學畢業(yè)后的第一份工作是給曠視科技做面部標記,這是一家價值20億美元的中國面部識別公司,其最著名的技術平臺名為Face++。到目前,一些面部識別系統(tǒng)可以比識別她的朋友更快地識別她,她說這是因為“我的臉在原始數(shù)據(jù)庫里。”
但北京的生活太過艱難而且昂貴。她和當時的未婚夫趙亞成決定搬回家鄉(xiāng)做數(shù)據(jù)工廠。她的父母可以出電腦和辦公桌的費用。他們正在翻新隔壁的倉庫,再雇用80多名員工。
像伊亞科一樣,侯夏夢并沒有花時間思考自己的工作所帶來的影響。它們是否有助于國家的監(jiān)視,以及機器控制人類的反烏托邦未來?
“攝像頭讓我感覺安全,”她說。“最起碼現(xiàn)在是我們在控制機器。”