對于一個理應(yīng)奇缺人才的領(lǐng)域,數(shù)據(jù)科學(xué)似乎在快速造就大批新專家。不久前,1600人出席了華盛頓大學(xué)(University of Washington)機器學(xué)習(xí)教授卡洛斯 格斯特林(Carlos Guestrin)執(zhí)掌的公司Turi在舊金山主辦的一次數(shù)據(jù)科學(xué)峰會,表明數(shù)據(jù)科學(xué)引起的興趣是多么的濃厚。
格斯特林提出,所有軟件應(yīng)用在5年內(nèi)都將需要內(nèi)置的智能,使數(shù)據(jù)科學(xué)家——經(jīng)過培訓(xùn),能夠?qū)A繑?shù)據(jù)進行分析的人員——成為這一新興“認(rèn)知”技術(shù)經(jīng)濟中的關(guān)鍵工作者。
無論這種關(guān)于數(shù)據(jù)科學(xué)即將無處不在的預(yù)測正確與否,目前已有一些核心的關(guān)鍵應(yīng)用依賴機器學(xué)習(xí),最主要的是推薦程序、欺詐探測系統(tǒng)、預(yù)報工具和旨在預(yù)測顧客行為的應(yīng)用。
把直到不久以前還專屬于研究科學(xué)家的技術(shù)納入生產(chǎn)級的業(yè)務(wù)應(yīng)用程序,可能指向企業(yè)競爭力的一種深刻變化。在Turi活動上炫耀數(shù)據(jù)科學(xué)和機器學(xué)習(xí)技能的公司——包括優(yōu)步(Uber)、Pinterest和Quora——都創(chuàng)立于數(shù)字時代。
舉辦在線數(shù)據(jù)科學(xué)競賽的Kaggle的首席執(zhí)行官安東尼 戈德布盧姆(Anthony Goldbloom)表示,一些在模擬世界里成長壯大的公司,比如沃爾瑪(Walmart),也在大舉投資于數(shù)據(jù)科學(xué)領(lǐng)域。但他預(yù)測稱,它們不太可能趕上亞馬遜(Amazon)之類公司,這類公司擁有先發(fā)優(yōu)勢,并且動作很快。隨著相關(guān)技術(shù)在不同行業(yè)推廣,隨著智能系統(tǒng)發(fā)揮越來越關(guān)鍵的作用,這些趨勢可能導(dǎo)致行業(yè)領(lǐng)導(dǎo)地位發(fā)生天翻地覆的變化。
拖累許多傳統(tǒng)公司的一個因素,將是開展真正的機器學(xué)習(xí)運作的高成本。
一名知情人士表示,Netflix估計在一個單一應(yīng)用——其電影推薦系統(tǒng)——上每年支出1.5億美元,而一旦把該公司對相關(guān)技術(shù)的所有應(yīng)用都考慮在內(nèi),總賬單很可能是這一金額的四倍。
許多創(chuàng)立時具有數(shù)字基因的公司——尤其是那些擁有海量實時客戶交互數(shù)據(jù)可以挖掘的互聯(lián)網(wǎng)公司——對數(shù)據(jù)科學(xué)的投入是不遺余力的。例如,Pinterest的首席科學(xué)家尤雷 萊斯科韋茨(Jure Leskovec)表示,該公司維護著逾100種可以應(yīng)用到不同類型問題中去的機器學(xué)習(xí)模型,不斷處理熱切希望利用這些資源解決業(yè)務(wù)問題的經(jīng)理們的請求。
人才是許多非科技公司的另一個問題。盡管數(shù)據(jù)科學(xué)家正大量涌現(xiàn)出來,但有些技能十分短缺,尤其是在深度學(xué)習(xí)方面——這是最高形式的機器學(xué)習(xí)。戈德布盧姆說,在使用Kaggle的自由職業(yè)計算機科學(xué)專家中,僅有大約1000人擁有深度學(xué)習(xí)技能,而可以運用其他機器學(xué)習(xí)方法的有10萬人。
他接著說,大公司經(jīng)常不愿調(diào)整自己的工資等級去聘用該領(lǐng)域的頂級人才,即便某個高薪專家開發(fā)的算法可能對公司業(yè)務(wù)起到超出比例的效果。
然而,適應(yīng)即將到來的“智能”應(yīng)用時代的最大障礙,可能是文化上的。有些公司,比如通用電氣(GE),一直在硅谷打造自己的研發(fā)團隊,以吸引和開發(fā)他們將需要的數(shù)字技能。但是,他們將不得不把新的數(shù)據(jù)科學(xué)家和機器學(xué)習(xí)專家安排到運營部門中去,讓他們更接近部門經(jīng)理,才能收獲全部好處。
科學(xué)與業(yè)務(wù)實踐之間的這種結(jié)合是至關(guān)重要的。不言而喻的是,從現(xiàn)在開始,所有的經(jīng)理都將需要在數(shù)據(jù)引導(dǎo)下做出決策。但那需要思維模式的徹底改變,說來容易做來難。
戈德布盧姆說,這一挑戰(zhàn)已變得更為艱巨,因為經(jīng)理們被要求圍繞新的“智能應(yīng)用”重新設(shè)計自己的工作流程,在一定程度上使他們自己失去存在的必要性。
盡管存在種種障礙,有些公司或許能處理好這一艱難的轉(zhuǎn)型。但是,那些在創(chuàng)立之時就把數(shù)據(jù)科學(xué)和機器學(xué)習(xí)作為業(yè)務(wù)核心的公司,很可能構(gòu)成強大競爭。