數據挖掘領域是一個獨特的行業,通常的招聘方法可能不大適用于本行業的特點。在招聘一個合格的數據挖掘工程師時,公司一般關注以下三個方面:
1、他聰明嗎?
聰明意味著能夠透過復雜的信息建構問題并以正確的方式加以解決。聰明人還能從失敗中獲取經驗。
2、他是否專注于項目?
專注意味著在各種困難的環境中,仍能獨立或合作完成項目。
3、他能否與團隊一起工作?
團隊合作需要很好的溝通能力。工作中涉及到的概念、問題、模型和結論等都需要成員之間正確的溝通方能加以明確。
為了解候選人是否具有數據挖掘工程師的潛質,需要一個小時以上的面試,類似于以下五個環節:
1、簡介
交談寒暄,使候選人放松下來,互相介紹和問答。
2、關于數據挖掘項目
這是一個重要和耗時的環節,主要是詢問候選人最近進行的數據挖掘項目的情況和處理方式。一般包括以下方面:候選人如何描述這個項目?候選人在項目中處于什么角色和有什么貢獻?項目持續了多長時間?這個項目的關鍵問題是什么?問題如何解決?數據挖掘中最困難的階段是什么?最有趣的經歷或階段是什么?在候選人眼里,客戶是什么樣的?在他眼里,團隊其他成員是如何表現的?候選人從中獲得了什么樣的經驗?……
在這個環節,不僅要向候選人提問”What“的問題,還要多溝通關于”Why“的問題。因為優秀的數據挖掘工程師要能夠面對客戶壓力和要求,清晰地支持回應他們的要求,并有理有據地論證他們提出的觀點。
3、關于數據挖掘的流程
考察候選人對于工作流程的認識是必要的,如果他談到了跨行業數據挖掘流程規范(CRISP-DM)意味著好兆頭。有很多時候,候選人對這些規范不以為然。雖然說從不同的角度來看待問題是一種創新,但是創新也需要建立在堅實的流程標準之上,以保證人為決策不會出現大紕漏。必要時,可以讓候選人在白板上畫出工作流程圖,并讓他評價這些工作中最為重要或者最需要反思的地方。因為建模工作不可能一次完成,需要反復地提煉問題和重建模型的情況是經常遇到的。
另外,面試中也可能會集中在某個挖掘流程進行深入考察,例如詢問如何避免過度擬合、如何從大量的候選變量中進行篩選、如何評價比較模型的效果等。
4、解決問題
軟件公司的面試一般會包括”編碼測試“,考察數據挖掘工程師也應該如此。一種通用的做法是提供一份存在缺陷的分析報告,讓候選人對報告進行研究,闡述報告中結論的意義,提出其中所存在的問題或不足,以及改進或補救的方法。
5、收尾
在面試的最后階段,面試方需要回答候選人提出的問題,并使之相信公司在本行業的優勢地位或者光明前景,以及從事這個崗位在職業生涯中的作用。在完成面試后,面試人通常會立即將面試記錄整理存檔。
對于面試人和候選人來說,面試都是繁重的,但也是一個交流學習的好機會。通過面試,雙方可以了解到其他人遇到的問題,以及他們是如何解決問題的。