Intetix Foundation(英明泰思基金會(huì))由從事數(shù)據(jù)科學(xué)、非營(yíng)利組織和公共政策研究的中國(guó)學(xué)者發(fā)起成立,致力于通過(guò)數(shù)據(jù)科學(xué)改善人類社會(huì)和自然環(huán)境。通過(guò)聯(lián)絡(luò)、動(dòng)員中美最頂尖的數(shù)據(jù)科學(xué)家和社會(huì)科學(xué)家,以及分布在全球的志愿者,我們創(chuàng)造性地踐行著我們的使命:為美好生活洞見(jiàn)數(shù)據(jù)價(jià)值。
原文:https://www.gsb.stanford.edu/insights/susan-athey-how-big-data-changes-business-management
原作者:Kathleen O'Toole
斯坦福經(jīng)濟(jì)學(xué)家解釋電子數(shù)據(jù)寶庫(kù)如何為競(jìng)爭(zhēng)開(kāi)創(chuàng)新格局 !大量的數(shù)據(jù)收集正在改變著組織管理。(Steve Castillo拍攝)
電子數(shù)據(jù)的激增使得管理者能夠量化并徹底了解他們的業(yè)務(wù),也就是說(shuō)他們此用于升級(jí)產(chǎn)品或制造出全新的產(chǎn)品。斯坦福大學(xué)商學(xué)院經(jīng)濟(jì)學(xué)教授同時(shí)也是微軟和其他科技公司的咨詢師Susan Athey,與《斯坦福商業(yè)雜志》討論了大量數(shù)據(jù)的收集、廉價(jià)的儲(chǔ)存和利用數(shù)據(jù)寶庫(kù)中進(jìn)行機(jī)器學(xué)習(xí)的這些方面是如何對(duì)受網(wǎng)絡(luò)驅(qū)動(dòng)的新興行業(yè)以及傳統(tǒng)商業(yè)的管理方式進(jìn)行改革的。
以下是本次采訪的節(jié)選。
問(wèn):您是如何看待大數(shù)據(jù)技術(shù)改變硅谷的管理技巧以及之后發(fā)展的?答:“管理者需要理解并且評(píng)估分析師的研究結(jié)果,他們發(fā)現(xiàn),如果自己不能直接參與管理,就會(huì)面臨著遺忘或者遭到遺棄。” 在硅谷,大多數(shù)互聯(lián)網(wǎng)相關(guān)領(lǐng)域的公司都存在著一個(gè)顯著的特征:有著由大數(shù)據(jù)引起的對(duì)新且多樣化技能集的巨大需求。明顯地,必然有對(duì)數(shù)據(jù)分析的大量需求。在分析的范圍內(nèi),需要有人撰寫(xiě)代碼,從大量的數(shù)據(jù)源沖提取數(shù)據(jù)并整合成有用的數(shù)據(jù)格式。也需要有人對(duì)這些數(shù)據(jù)進(jìn)行簡(jiǎn)單地分析,同時(shí)一些人做更加復(fù)雜的統(tǒng)計(jì)分析,這其中包含著機(jī)器學(xué)或計(jì)量經(jīng)濟(jì)學(xué)的知識(shí),例如建造數(shù)據(jù)模型可以預(yù)測(cè)網(wǎng)頁(yè)里的鏈接哪些會(huì)被點(diǎn)擊或?yàn)g覽網(wǎng)頁(yè)時(shí)應(yīng)該提供給消費(fèi)者哪些產(chǎn)品。在高科技公司里,管理者需要理解并且評(píng)估分析師們的研究結(jié)果,他們發(fā)現(xiàn),如果自己不能直接參與管理,就會(huì)面臨著遺忘或者遭到遺棄。在商業(yè)常規(guī)業(yè)務(wù)中創(chuàng)造的分析數(shù)據(jù)之外,一個(gè)新領(lǐng)域涉及了管理的大規(guī)模實(shí)驗(yàn)平臺(tái)以及從實(shí)驗(yàn)中的分析數(shù)據(jù)。
問(wèn):我聽(tīng)說(shuō)谷歌的專家一年運(yùn)行成千上萬(wàn)個(gè)實(shí)驗(yàn),正是實(shí)驗(yàn)中的數(shù)據(jù)而不是管理人本身決定了公司的方向。事實(shí)上,在互聯(lián)網(wǎng)公司的一些數(shù)據(jù)專家傾向于將那些不基于數(shù)據(jù)的想法和直覺(jué)不屑地稱為河馬觀點(diǎn)(hippos),而這也代表著“高收入人群觀點(diǎn)”。您認(rèn)為這是準(zhǔn)確的界定方法嗎?答:管理模式明顯地正在改變。不僅是谷歌和微軟這樣的大公司,甚至是最小的公司都通過(guò)強(qiáng)制的實(shí)驗(yàn)過(guò)程改變搜索引擎的算法。這也意味著產(chǎn)品只有經(jīng)過(guò)嚴(yán)格的統(tǒng)計(jì)檢查才可能見(jiàn)到光明。因?yàn)楣镜暮诵漠a(chǎn)品的建立是基于數(shù)據(jù)管理方式運(yùn)行的,沒(méi)有來(lái)自統(tǒng)計(jì)學(xué)家和數(shù)據(jù)科學(xué)家的評(píng)估研究和預(yù)測(cè),管理者在財(cái)務(wù)和商業(yè)方面的計(jì)劃無(wú)法實(shí)現(xiàn)其目的。因此,即使是代表數(shù)據(jù)分析師的MBA們?nèi)孕枰酝笍?fù)雜的分析并且能夠與工程師和產(chǎn)品團(tuán)隊(duì)進(jìn)行交流,而他們的專業(yè)語(yǔ)言就是數(shù)據(jù)。
就我經(jīng)驗(yàn)而言,MBA中能有好的商業(yè)直覺(jué)并且能夠聰明地運(yùn)用統(tǒng)計(jì)學(xué)家語(yǔ)言的都是“搖滾明星”。他們能夠很好的理解數(shù)據(jù)能證明的什么、不能證明什么,并且如何高效地利用數(shù)據(jù)做決定。他們知道如何利用數(shù)據(jù)來(lái)證明一個(gè)觀點(diǎn),更加視覺(jué)化的呈現(xiàn)信息,將收集的案例放在一起,所有的用來(lái)支持主要的結(jié)論。擁有這些才能的管理者會(huì)被其他公司挖走或在本公司得到快速晉升。他們給予執(zhí)行報(bào)告并且他們是任何重要戰(zhàn)略項(xiàng)目的不可或缺人員。這也是其他行業(yè)期望的前進(jìn)方向。
問(wèn):除了在線運(yùn)行的實(shí)驗(yàn),對(duì)于商業(yè)而言,大數(shù)據(jù)所帶來(lái)的下一個(gè)大的改變是什么?答:在監(jiān)測(cè)設(shè)備或網(wǎng)站實(shí)時(shí)獲取與用戶進(jìn)行相互作用的手機(jī)上的數(shù)據(jù),并能及時(shí)進(jìn)行機(jī)器學(xué)習(xí),這也使得公司能夠面對(duì)其競(jìng)爭(zhēng)對(duì)手時(shí),提高自身的業(yè)績(jī)。互聯(lián)網(wǎng)公司正在處在基于機(jī)器學(xué)習(xí)自動(dòng)決策的前沿,但是它在其他領(lǐng)域的應(yīng)用也會(huì)帶來(lái)價(jià)值。
問(wèn):您能解釋一下機(jī)器是如何利用大量數(shù)據(jù)集進(jìn)行決策工作的嗎?答:考慮一下機(jī)器學(xué)習(xí)的最終算法—搜索引擎。人們查詢的目的是隨時(shí)間改變的。如果你今天輸入Amanda Bynes到搜索框,搜索引擎會(huì)非常迅速的查找其他人在今天搜索Amanda Bynes時(shí)看到的網(wǎng)頁(yè)并點(diǎn)擊的內(nèi)容。今天很重要是因?yàn)槟阆胍谋厝缓妥蛱觳煌?/p>
例如,當(dāng)Michael Jackson逝世時(shí),網(wǎng)絡(luò)流量猛增,搜索引擎公司希望能夠在最初的30秒內(nèi)阻止發(fā)送給人們關(guān)于演出者的普通網(wǎng)頁(yè),取而代之的是開(kāi)始發(fā)送給他們最新的新聞。通過(guò)使用最新的數(shù)據(jù),一個(gè)你想要的眾包數(shù)據(jù),一個(gè)搜索引擎可以成為一個(gè)快速的學(xué)習(xí)者。
所有的搜索引擎都試著這樣做,但是他們能做的多好關(guān)鍵取決于他們獲得數(shù)據(jù)的速度有多快。因此Google會(huì)比Bing做的更好,因?yàn)楦嗳耸走xGoogle。Amazon可以擊退小的零售運(yùn)營(yíng)商。如果你在Amazon中輸入“嬰兒車”,算法會(huì)為你個(gè)人找出最好的網(wǎng)頁(yè)版本。該算法使用了一種聯(lián)合方式,即確定你是哪種類型的消費(fèi)者,以及像你這樣的消費(fèi)者在過(guò)去一段時(shí)間里的點(diǎn)擊內(nèi)容。
當(dāng)我和在互聯(lián)網(wǎng)以外的公司談?wù)摍C(jī)器決策時(shí),他們常常沒(méi)有意識(shí)到大量數(shù)據(jù)的重要性。實(shí)際上,多年來(lái),人工智能研究專家認(rèn)為,如果他們理解了互聯(lián)網(wǎng)的鏈接結(jié)構(gòu)和語(yǔ)言結(jié)構(gòu),就能夠幫助人們獲到更好的搜索結(jié)果。但實(shí)際上,擁有更多關(guān)于人們使用搜索引擎表現(xiàn)行為的數(shù)據(jù)也很關(guān)鍵。了解人們?cè)谳斎胩囟ǖ倪B續(xù)的三個(gè)字母時(shí)代表的最常見(jiàn)的東西可能比語(yǔ)義上的理解更有意義。這意味著在行業(yè)里,機(jī)器學(xué)習(xí)對(duì)于產(chǎn)品的質(zhì)量十分重要,你將會(huì)看到公司會(huì)更加集中,同時(shí)新公司將會(huì)更難的取得進(jìn)展。
問(wèn):這就是投資者愿意將數(shù)百萬(wàn)美元投入沒(méi)有利潤(rùn)但是能增長(zhǎng)寶貴數(shù)據(jù)的項(xiàng)目的原因嗎?答:拿移動(dòng)手機(jī)服務(wù)作為例子。如果你能讓更多手機(jī)使用者使用你的聲音服務(wù),你將會(huì)在聲音識(shí)別上做得更好,也會(huì)為你的顧客帶來(lái)高質(zhì)量的產(chǎn)品。這是你核心產(chǎn)品所能達(dá)到的能力,同時(shí)也是差異化的來(lái)源。這個(gè)數(shù)據(jù)的價(jià)值在于如何在不同的投資環(huán)境中理解語(yǔ)音功能。你能想象到,能夠收集一大堆數(shù)據(jù)的公司,在顧客需要語(yǔ)音識(shí)別時(shí),將會(huì)沒(méi)有能直接競(jìng)爭(zhēng)的對(duì)手,并將它作為突出的產(chǎn)品賣出去。用戶通過(guò)觸摸屏接口的所有產(chǎn)品都將會(huì)有此功能。所以,如果人們?cè)噲D通過(guò)打字、說(shuō)話、使用觸屏、寫(xiě)字或手勢(shì)去連接一個(gè)設(shè)備,那么一個(gè)擁有大量輸入的文本集的公司將會(huì)在用戶的輸入理解上會(huì)更快并且更準(zhǔn)確。
一些互聯(lián)網(wǎng)公司因?yàn)橄胍奂鄶?shù)據(jù),在很多方向上進(jìn)行整合,而語(yǔ)音識(shí)別只是你看到的普遍現(xiàn)象中的一個(gè)例子。他們并不希望他們的競(jìng)爭(zhēng)者擁有數(shù)據(jù)來(lái)使他們的產(chǎn)品更好,或讓他們?cè)囍鴮?shù)據(jù)用其他方式變現(xiàn),例如通過(guò)更加個(gè)性化和更具有目標(biāo)性的廣告。
問(wèn):在哪個(gè)行業(yè),您希望看到大數(shù)據(jù)打亂它的常規(guī)業(yè)務(wù)呢?答:這將是有趣預(yù)測(cè):哪個(gè)領(lǐng)域?qū)?huì)更快地有效地使用數(shù)據(jù)。例如,你會(huì)認(rèn)為,當(dāng)你的航班延誤時(shí),用一個(gè)自動(dòng)航班預(yù)訂系統(tǒng)來(lái)改變一個(gè)連接行航班預(yù)訂會(huì)比調(diào)動(dòng)車來(lái)開(kāi)要方便更多。因?yàn)橛衼?lái)電顯示,當(dāng)你從停機(jī)坪上叫車時(shí),航空公司會(huì)知道你是誰(shuí)。然而,在這種情況下,許多乘客都被耗費(fèi)時(shí)間的航空電話弄得十分沮喪,只是在最近,我們才看到航空公司在這方面的體驗(yàn)有真正的改善。另一方,汽車能自己安全的駕駛。另一個(gè)有吸引力的數(shù)據(jù)傳感器的應(yīng)用是用來(lái)監(jiān)測(cè)復(fù)雜機(jī)器的零件,例如汽車或飛機(jī),并學(xué)會(huì)如何提高機(jī)器安全性或決定何時(shí)替換損壞的零件。醫(yī)療診斷同樣也是一個(gè)例子,機(jī)器仔細(xì)研讀兆字節(jié)的數(shù)據(jù)會(huì)比醫(yī)生更快更準(zhǔn)確,僅僅是在極少的情況下,或是特定患者的治療中有少見(jiàn)的副作用。
你可能會(huì)驚訝于一些案例。你可能會(huì)認(rèn)為像出租車這樣的行業(yè)會(huì)很難進(jìn)入,因?yàn)樗潜划?dāng)?shù)卣叨裙苤频拿舾行袠I(yè)。然而,已有公司在很多城市成功進(jìn)入,他們運(yùn)用實(shí)時(shí)需求數(shù)據(jù)在供給短缺時(shí)提高價(jià)格,確保那些愿意支付更多錢的人找到出租車。
問(wèn):對(duì)于老數(shù)據(jù)可以找到新的用法嗎?答:這里有大量的方法來(lái)回答重要的政策問(wèn)題,不僅有公共政策還有商業(yè)政策的問(wèn)題,使用運(yùn)營(yíng)的或被動(dòng)方式收集到的數(shù)據(jù)用于其他目的。所有的社會(huì)科學(xué)家積極主動(dòng)地從社交媒體上挖掘數(shù)據(jù)來(lái)研究任何事情,例如推特,從幸福的事情到青少年社會(huì)準(zhǔn)則再到社會(huì)動(dòng)亂的基礎(chǔ)。學(xué)術(shù)界和金融行業(yè)都有像Google Trends的資源,來(lái)尋找搜索模式,能夠用來(lái)預(yù)測(cè)流感的爆發(fā),可以用于失業(yè)的統(tǒng)計(jì),同樣適用于股票的回升情況。另一個(gè)增長(zhǎng)趨勢(shì)是學(xué)術(shù)界研究者與公司合作從而有獲得大型數(shù)據(jù),同時(shí)公司可以從研究者的專業(yè)知識(shí)中學(xué)習(xí),并且研究者能夠回答研究使用公司專用的數(shù)據(jù)集的各種問(wèn)題。此公布的研究只顯示總量的統(tǒng)計(jì)數(shù)據(jù),從而保護(hù)數(shù)據(jù)的機(jī)密性。在這件事上,我已和微軟研究院進(jìn)行合作并且卓有成效,其他公司,如eBay和Yahoo也同樣成功地與學(xué)術(shù)界進(jìn)行合作。
想到一個(gè)較不明顯的例子:城市。芝加哥、紐約,以及一些國(guó)家,現(xiàn)在都在做大規(guī)模的數(shù)據(jù)收集。因?yàn)檫@些數(shù)據(jù)正變得具有可獲取性,它能有用于一些直接的目的,例如受數(shù)據(jù)驅(qū)使的政策或交通和交通流的管理。但是我們僅僅是開(kāi)始看到數(shù)據(jù)的從屬功用所帶來(lái)的可能性,數(shù)據(jù)關(guān)注就像在對(duì)非常微小級(jí)別的噪音、能源利用和污染一樣。你可以聚集噪音的數(shù)據(jù)來(lái)識(shí)別是否違反噪聲條例,但之后你發(fā)現(xiàn)可以用它來(lái)研究噪音對(duì)兒童健康的影響。你可以收集關(guān)于出租車司機(jī)出行數(shù)據(jù),用來(lái)監(jiān)控其是否遵守各種規(guī)章制度,但在最后了解到通勤模式、公共交通的缺口、甚至是不同類型的顧客給小費(fèi)的傾向。我期望也能在商業(yè)中看到。他們也許是被動(dòng)地收集關(guān)于他們的顧客和汽車之間的關(guān)系。按照這種方式,他們也許會(huì)發(fā)現(xiàn),顧客如何使用汽車的模式,對(duì)設(shè)計(jì)交通系統(tǒng)有著普遍的意義,對(duì)于城市規(guī)劃,以及如何設(shè)計(jì)未來(lái)的汽車的用處。
對(duì)于公司和政府而言,能夠全面利用他們所擁有的數(shù)據(jù)會(huì)很困難,因?yàn)楸C苄院蛿?shù)據(jù)安全的問(wèn)題,但是令人更加驚喜的應(yīng)用將必然出現(xiàn)。任何產(chǎn)業(yè)都可能會(huì)是下一個(gè)能夠以令人矚目的方式重新思量并進(jìn)行創(chuàng)新的產(chǎn)業(yè)。