每天早上,Brenda 從家離開,乘坐公共汽車前往內羅畢東部,和她的 1000 多名同事一起,在同一棟樓開始一天八小時的工作。
她的主要工作內容是建立訓練數據集,將信息尤其是圖像處理為一種計算機可以識別的格式:上傳圖片,然后用鼠標標記幾乎所有內容,包括人、車輛、交通標識、道路標記,甚至是天空,尤其是要標記其能見度是晴天還是多云。
這一切將服務于一個他們之前鮮有耳聞的概念——人工智能。從這里輸出的數百萬個類似的圖像將流入人工智能系統中。以自動駕駛為例,這意味著系統可以開始「識別」現實世界中的物體了。而數據量越大,機器就越智能。
但這些技術成果或許永遠都不會被基貝拉享受到。作為非洲最大的貧民窟,它有當前更迫切需要解決的問題,例如缺乏可靠的清潔水,以及眾所周知的衛生危機。
他們的工作結果將由一位上級進行檢查,如未達到標準,則將被退回。對于速度最快,標記最準確的標記師,他們的名字將榮登辦公室附近的屏幕上。最受歡迎的獎勵則是商場購物券。
為了確保每一個像素都被正確標記,Brenda 和她的同事們每天工作時需要離電腦屏幕很近很近。
但沒有人抱怨,「每個人都該做點與眾不同的事,」Brenda 對自己這份工作非常滿意,「我相信我的工作將會對未來的人們有所幫助。」
貧民窟中的人工智能學校
Brenda 所在的公司名叫 Samasource。這是一家總部位于舊金山的公司,其客戶包括谷歌、微軟、Salesforce 和雅虎。
大多數公司不愿談及他們與 Samasource 合作的具體內容,因為這通常涉及的是公司未來的項目。但眾所周知,Samasource 的前期數據整理是這些硅谷巨頭在人工智能領域項目的重要組成部分。
似乎離這里無比遙遠,但人工智能在這里依然帶來了積極的影響。
BBC 記者采訪過程中驅車前往基貝拉的一座歷史性建筑物,這座建筑物位于一條鐵路線附近。在下雨天,建筑物被泥漿包裹。但自殖民地時期開始以來,它就一直有人在用。
一年多前,這座建筑物還是暴徒和軍隊之間的分界線。今天,它變成了一個蓬勃發展的活動中心,包括一所媒體學校和媒體工作室,一家自助餐廳。而一樓有一間機房,在這里,Gideon Ngeno 向 25 名學生教授使用個人電腦的基本知識。
令人驚訝的是,即便是在基貝拉這樣的地方,數字化程度也很高。智能手機十分普遍,充電器及相關配件也很容易找到,人們還會用 MPesa 支付系統進行購買。
但大部分的非洲地區跳過了個人電腦的時代。鼠標和鍵盤的組合對他們而言是一種陌生且繁瑣的體驗。Samasource 員工告訴我,當需要查找資料時,公司里的大部分人常常會離開電腦直接拿出手機。
Ngeno 教授的這項課程是專為想去 Samasource 或其他數字經濟公司的人設計的。學費需要 500 肯尼亞先令,約合五美元。對于生活在貧困線以下的人來說這也不是一筆小數目。公司曾嘗試免費授課,但沒有了經濟壓力,出勤率和學員們的集中度都不盡如人意。
Ngeno 說,最大的挑戰其實是噪音。在我們講課的同時,一群熊孩子正在窗外拿著樂器玩耍。教室外就是一個喧鬧的市場。
「非洲硅谷」
相比之下,Samasource 的位于內羅畢的辦公室是這里城市化水平最高的地方。公司占據了商業園區其中一座建筑的四層樓,擁有大量用于數據處理培訓的計算機。
如果你不看窗外的景色,你可能會認為你正置身于硅谷的一家科技公司。覆蓋著瓦楞鐵的墻壁在加州被認為是一種「后工業化風」,在這里卻是一種標記,提醒著人們約 75% 的員工都來自貧民窟。
最令人印象深刻的是,Samasource 克服了大多數硅谷公司正在努力解決的問題——性別歧視。
在這里,超過一半的勞動力由女性組成,結婚并不會阻礙女性的事業發展。長達 90 天的產假以及輪班模式的靈活性使該公司成為肯尼亞乃至全球范圍內公司文化有包容性的典范。
負責管理人力資源的 Hellen Savala 說:「我們相信,如果公司有一名男性,他就能養活他的小家庭,但如果公司有一名女性,她不僅能養活她的小家庭,她還能擔負起我們的大家庭。因此你會產生更大的影響力。」
廉價勞動力
Samasource 公司數據產品的準確性和安全性是 Google 等大客戶與他們合作的原因。但顯然,這些公司傾向于在勞動力成本低下的地區雇傭勞力,當地人也迫切需要穩定的工作。
Samasource 的目標雇傭人群是那些目前單日收入在 2 美元以下或從事危險的非正規工作的人。Samasource 提供每天約 9 美元的工資。這對當地人的生活將會是一個巨大的改進,盡管對硅谷來說這些錢卻微不足道。
「是的,它具有成本效益,」Janah 說。「但在我們的工作中至關重要的一件事是使我們支付的工資額度不會扭曲當地勞動力市場。如果我們向人們支付的金額遠大于此,我們就會把物價整體抬高。這會對當地的社區住房和食物成本產生負面影響。
當然,還有一個更為重大的問題是這項工作的持續性。畢竟 Samasource 的主要業務是為自動化過程提供數據。如果創建數據的過程也變得自動化,公司將何去何從?
「大多數人都認為這是花十億美元就可以解決的技術問題,」Janah 說。
「我認為目前這只是炒作,如果你真的與數據科學家交談這些算法背后的思想,你會發現機器比大多數人認為的要落后許多。
「市場將在很長時間內仍需要人工訓練數據集。」
「它改變了我的一切」
成為一名數據標記師是一項無聊、重復且無休無止的工作。避開攝像機鏡頭時,一些工作人員會愿意聊聊他們如何減少休息時間,以應對工作壓力達到公司目標。 Samasource 的部分員工是不限工作地點的自由職業者,但在工作時間會有網絡攝像頭對他們的工作進行監管。
經我們觀察,辦公室內幾乎沒有人體工程學的設備來為工作人員服務。長時間的蹲伏、點擊都將對視力和身體造成一定傷害。該公司已表示將對此采取改善措施。
Samasource 相信它已經對發展中國家近 5 萬人產生了積極影響;那些人要么在 Samasource 工作,要么得到過 Samasource 員工的支持。Samasource 調查了他的前雇員,發現其中約 84%的人找到了更正式的工作或接受了高等教育。
25 歲的 Idris Abdi 是其中一員,他也因此搬出了貧民窟。
他說,「Samasource 改變了我的一切,它改變了我的眼界,讓我看到除了生活在這片土地之外新的希望。」