但是當(dāng)數(shù)據(jù)科學(xué)家進(jìn)行面試時,應(yīng)該具備的一項關(guān)鍵技能可能在提交審查的簡歷上并不能看到。這不是熟悉Python或R或Spark或其他一些新技術(shù)或平臺,也不是了解最新的機(jī)器學(xué)習(xí)方法或新算法;也不是從頭開始編寫人工智能算法,或在幾分鐘內(nèi)分析數(shù)TB的數(shù)據(jù)的能力。
雖然這些知識非常重要,但它們不是軟技能。事實(shí)上,使數(shù)據(jù)科學(xué)家成為搖滾明星的一項技能根本不是技術(shù),而是所謂的軟技能:溝通能力。
在創(chuàng)建一些瘋狂的機(jī)器學(xué)習(xí)系統(tǒng)來構(gòu)建推薦引擎時,企業(yè)正在面試的數(shù)據(jù)科學(xué)家可能是世界上最聰明的人之一,但如果他們沒有這種軟技能就很難取得成功。他們將會遇到一些困難,無法充分挖掘他們的潛力。
其“戰(zhàn)略”是什么?當(dāng)企業(yè)傳達(dá)輸出/結(jié)果時,數(shù)據(jù)科學(xué)家需要能夠討論的不僅僅是標(biāo)準(zhǔn)信息(錯誤率/指標(biāo)等)。他們還需要能夠達(dá)到關(guān)鍵的“W”點(diǎn):什么,為什么,何時,何地,以及是誰。他們必須能夠清楚地定義他們做了什么,為什么這樣做,他們的方法何時起作用(或者不起作用),他們的數(shù)據(jù)來自何處,以及誰將受到他們所做的影響。如果他不能以一個外行能理解的方式簡潔地回答這些問題,那么就是一個失敗的數(shù)據(jù)科學(xué)家。
兩個現(xiàn)實(shí)世界的例子
有兩個例子可以幫助了解出色的數(shù)據(jù)科學(xué)家(即溝通良好的人)和一個不那么出色的數(shù)據(jù)科學(xué)家之間的區(qū)別,例子提供了兩者的背景知識,讓企業(yè)自己決定聘請哪一位數(shù)據(jù)科學(xué)家。并假設(shè)這兩位數(shù)據(jù)科學(xué)家都在同一個組織工作。
第一位數(shù)據(jù)科學(xué)家:
她從事數(shù)據(jù)科學(xué)工作已經(jīng)四年。她在數(shù)據(jù)探索、功能工程、機(jī)器學(xué)習(xí)和數(shù)據(jù)管理方面擁有豐富的經(jīng)驗。在她的職業(yè)生涯中,她實(shí)施了多個需要深入研究大型數(shù)據(jù)集的項目,在分析過程中她使用不同的系統(tǒng)、平臺和語言。
對于她所從事的每個項目,她都會在筆記本上留下評論、想法、變化以及她正在做的事情的理由,畢竟她是一名科學(xué)家。當(dāng)她向團(tuán)隊成員和管理層提供更新時,她不僅僅關(guān)注數(shù)據(jù),還關(guān)注數(shù)據(jù)能夠傳達(dá)的內(nèi)容。她對自己的所有工作都作了詳盡的描述,并詳細(xì)說明了為什么事情是按自己的方式進(jìn)行的,以及潛在的變化可能如何影響她工作的結(jié)果。
對于項目“總結(jié)”文檔,她提供了一個執(zhí)行摘要,其中包含許多直觀的描述,簡要描述項目、她所做的工作、為什么這么做,做了什么、她認(rèn)為可以做什么來改進(jìn)事情,以及如何改進(jìn)項目。除了執(zhí)行摘要之外,她還提供了一份詳盡的報告,描述了整個過程,其中包含多個附錄和解釋性陳述,供那些想深入了解項目的人使用。當(dāng)人們選擇人們從事他們的項目時,當(dāng)他們開始談?wù)搱F(tuán)隊成員時,想到的人第一個人就是她。
第二位數(shù)據(jù)科學(xué)家:
他從事數(shù)據(jù)科學(xué)工作已經(jīng)四年多(比第一個人多了一個月)。他的技術(shù)背景非常專業(yè),他是團(tuán)隊中算法和編程語言的“專家”。考慮很全面,能解決很多困難。他在項目上非常成功,并受到全公司人士的青睞。
當(dāng)他在項目上工作時自行其事,很少記錄做了什么,以及為什么選擇。例如,如果同事問他為什么在一個項目中選擇隨機(jī)森林而不是支持向量機(jī)時,他會告訴,“因為它工作得更好”,但他無法解釋其“更好”的含義。雖然很少有人反對他在項目上的選擇,他的工作也很少受到質(zhì)疑,也沒有人質(zhì)疑他的技術(shù),但同事總是在項目中/項目后質(zhì)疑“他在做什么?”“他做了什么?”這樣的問題。
對于結(jié)果的記錄和呈現(xiàn),他將預(yù)期的基本報告與適當(dāng)?shù)男畔⒎旁谝黄穑藗兛偸怯袉栴}向他請教。但在考慮新項目時,他通常會排在最后,因為同事評價說,和他一起工作并不知道他在做哪些事情。
那么會選誰?
假設(shè)人們知道這兩位哪一個是出色的數(shù)據(jù)科學(xué)家。雖然第二人在技術(shù)上比第一人更精湛,但他的溝通技巧有點(diǎn)落后。第一個人是每個人在組織中提供“最佳”數(shù)據(jù)科學(xué)成果的人。而溝通就是差別。第一位數(shù)據(jù)科學(xué)家不僅能夠完成技術(shù)工作,還能以組織可以輕松理解的方式分享成果。
當(dāng)企業(yè)想聘請數(shù)據(jù)科學(xué)家時,通常會招聘擅長溝通或有能力提高溝通技巧的人。此外,作為一個組織,如果想成為一個優(yōu)秀的數(shù)據(jù)科學(xué)和分析公司,就必須擁有良好的溝通文化。