如今,當(dāng)組織需要從數(shù)據(jù)中獲得一些見(jiàn)解時(shí),他們首先傾向于尋找數(shù)據(jù)科學(xué)家的幫助。但這真的是一個(gè)更好的選擇嗎?人們需要了解數(shù)據(jù)科學(xué)家和數(shù)據(jù)分析師的角色有何不同,以及為什么希望聘用數(shù)據(jù)分析師。
聘用數(shù)據(jù)科學(xué)家還是數(shù)據(jù)分析師
那么,數(shù)據(jù)科學(xué)家和數(shù)據(jù)分析師之間的區(qū)別是什么?這些角色的定義可能有所不同,但通常認(rèn)為數(shù)據(jù)科學(xué)家結(jié)合了三個(gè)關(guān)鍵學(xué)科的知識(shí)——數(shù)據(jù)分析、統(tǒng)計(jì)、機(jī)器學(xué)習(xí)。機(jī)器學(xué)習(xí)涉及到數(shù)據(jù)分析的過(guò)程,以學(xué)習(xí)和生成分析模型,這些模型可以對(duì)看不見(jiàn)的數(shù)據(jù)執(zhí)行智能操作,并且人為干預(yù)最少。有了這樣的期望,很明顯具有這三方面技能的數(shù)據(jù)科學(xué)家也越來(lái)越受到企業(yè)的青睞。
但是,數(shù)據(jù)科學(xué)家在這三個(gè)方面的表現(xiàn)都是完美的嗎?更重要的是,所有這些角色都需要類似的技能嗎?或者說(shuō)數(shù)據(jù)分析師和機(jī)器學(xué)習(xí)工程師使用的技能和方法是完全不同的嗎?
事實(shí)上,這些專家的方法確實(shí)有很大不同。谷歌公司首席決策科學(xué)家Cassie Kozyrkov對(duì)這種差異提供了一個(gè)精辟的解釋。她聲稱,組織的數(shù)據(jù)分析師是為了提供快速的結(jié)果,例如分析數(shù)據(jù)中有趣的相關(guān)性。
為了滿足決策者對(duì)快速和簡(jiǎn)短答案的期望,數(shù)據(jù)分析師使用相應(yīng)的編碼風(fēng)格——使用更少的代碼行,并為管理者生成易于理解的相關(guān)矩陣。機(jī)器學(xué)習(xí)工程師有一個(gè)完全不同的編碼風(fēng)格,他們的目標(biāo)是建立一個(gè)完美的模型,這通常需要很多時(shí)間。
統(tǒng)計(jì)學(xué)家也無(wú)法提供快速結(jié)果,他們會(huì)說(shuō),“等等,我們無(wú)法從這些數(shù)據(jù)中得出任何因果關(guān)系。我們甚至不知道其結(jié)果是否具有統(tǒng)計(jì)意義!”是的,有時(shí)組織需要擅長(zhǎng)統(tǒng)計(jì)數(shù)據(jù)的統(tǒng)計(jì)學(xué)家或數(shù)據(jù)科學(xué)家來(lái)回答這類問(wèn)題。但是真的需要知道這些答案才能了解數(shù)據(jù)中的相關(guān)性嗎?
實(shí)際上沒(méi)有。在獲得數(shù)據(jù)分析師的初步結(jié)果后,組織應(yīng)聘請(qǐng)領(lǐng)域?qū)<遥麄兛梢詻Q定哪些已識(shí)別的模式對(duì)業(yè)務(wù)確實(shí)很重要,值得進(jìn)一步調(diào)查。人們可能已經(jīng)看到數(shù)據(jù)分析師在某些情況下比數(shù)據(jù)科學(xué)家更令人滿意。但現(xiàn)在需要澄清數(shù)據(jù)分析師應(yīng)該具備哪些技能來(lái)滿足決策者的需求,并成為組織的資產(chǎn)。
組織真正需要什么樣的數(shù)據(jù)分析師?
數(shù)據(jù)分析師在組織中的主要作用是通過(guò)識(shí)別數(shù)據(jù)中有趣且重要的模式,并提供隱藏在大量表格、圖表和日志文件中的快速答案來(lái)幫助決策者。簡(jiǎn)而言之,如果領(lǐng)域?qū)<野l(fā)現(xiàn)這些領(lǐng)域很重要,數(shù)據(jù)分析師會(huì)確定統(tǒng)計(jì)人員和機(jī)器學(xué)習(xí)工程師需要注意的領(lǐng)域。
因此,人們希望在數(shù)據(jù)分析師中看到以下品質(zhì):
•講述數(shù)據(jù)故事:優(yōu)秀的數(shù)據(jù)分析師可以閱讀數(shù)據(jù),并圍繞數(shù)據(jù)講述故事。數(shù)據(jù)專家從不超越數(shù)據(jù),總是提供多種可能的解釋。
例如,他們可以說(shuō):“我們?cè)贔acebook上推出一個(gè)廣告活動(dòng)后,我們似乎獲得了更多的潛在客戶。這可能是關(guān)于此活動(dòng)有效性的信號(hào),但潛在客戶數(shù)量的增長(zhǎng)也可能是由季節(jié)性變化引起的。需要進(jìn)行更深入的分析。”
•數(shù)據(jù)可視化技能:創(chuàng)建具有視覺(jué)吸引力、具有意義、易于解釋的圖形的能力對(duì)數(shù)據(jù)分析師也非常重要。其故事總是受益于出色的可視化,這使得決策者的工作變得更加容易。
•技術(shù)專長(zhǎng):專業(yè)數(shù)據(jù)分析師可以使用電子表格為組織提供隱藏在數(shù)據(jù)中的洞察力。但是,為了提供快速的結(jié)果,并創(chuàng)建專業(yè)的可視化,數(shù)據(jù)分析師通常需要電子表格之外的技術(shù)專業(yè)知識(shí)。
因此,人們期望數(shù)據(jù)分析師熟悉Python編程語(yǔ)言,并熟練使用Tableau或Microsoft Power BI等工具。
•針對(duì)速度優(yōu)化的編碼樣式:組織不需要數(shù)據(jù)分析師具有與軟件工程師或機(jī)器學(xué)習(xí)工程師相同的編程技能。數(shù)據(jù)分析師應(yīng)該知道如何使用Python清理數(shù)據(jù),如何執(zhí)行數(shù)據(jù)分析,以及如何使用清晰的可視化和表格來(lái)呈現(xiàn)信息。
網(wǎng)上有一些很好的課程可以培訓(xùn)這些技能。此外,數(shù)據(jù)分析師應(yīng)該熟悉為數(shù)據(jù)分析創(chuàng)建的最流行的數(shù)據(jù)包,并使用這些數(shù)據(jù)包以最有效的方式分析數(shù)據(jù)。
•領(lǐng)域?qū)I(yè)知識(shí):并非所有公司都需要數(shù)據(jù)分析師的領(lǐng)域?qū)I(yè)知識(shí),但這絕對(duì)是專業(yè)數(shù)據(jù)分析師的一項(xiàng)關(guān)鍵優(yōu)勢(shì)技能。換句話說(shuō),如果有人想成為最好的數(shù)據(jù)分析師,他們應(yīng)該熟悉某個(gè)領(lǐng)域。這種技能將幫助他們區(qū)分對(duì)業(yè)務(wù)真正重要的模式和不值得數(shù)據(jù)專家和決策者花費(fèi)時(shí)間的發(fā)現(xiàn)。
既然人們知道什么樣的數(shù)據(jù)分析師可以成為組織的寶貴資產(chǎn),那么總結(jié)一下人們對(duì)優(yōu)秀數(shù)據(jù)分析師的期望,以及為什么每個(gè)組織都需要這樣的專家。
每個(gè)公司都需要數(shù)據(jù)分析師
如果組織的管理者做出數(shù)據(jù)驅(qū)動(dòng)的決策,那么該組織肯定需要數(shù)據(jù)分析師。組織希望招募具有上述技能的優(yōu)秀專家,他們可以:
•收集正確的數(shù)據(jù)。
•清理數(shù)據(jù)。
•執(zhí)行數(shù)據(jù)分析。
•使用精美且有意義的可視化來(lái)呈現(xiàn)信息。
•發(fā)現(xiàn)數(shù)據(jù)中有趣的模式,并提供可能需要統(tǒng)計(jì)人員和機(jī)器學(xué)習(xí)工程師進(jìn)一步關(guān)注的見(jiàn)解。
•執(zhí)行分析時(shí),優(yōu)先考慮對(duì)業(yè)務(wù)更重要的區(qū)域。
總而言之,優(yōu)秀的數(shù)據(jù)分析師是決策者的主要助手,他們將數(shù)據(jù)轉(zhuǎn)化為有意義的故事,快速回答疑難問(wèn)題,并推動(dòng)組織業(yè)務(wù)朝著正確的方向發(fā)展。