hadoop啟蒙
還在實驗室時,老師就建議看google關(guān)于大數(shù)據(jù)的三篇論文,啃了好長時間還是沒完全理解。也動手搭建了Hadoop集群,運行了wordcount,帶著“Hadoop會火“的指示離開了實驗室。
Hadoop入門
2011年初我加入了一個互聯(lián)網(wǎng)流量分析運營項目,開始真正實戰(zhàn)Hadoop,編寫mapreduce程序。項目主要是對用戶瀏覽的url進行分析,挖掘用戶的上網(wǎng)行為偏好,進行精準(zhǔn)營銷。整個項目應(yīng)用到hadoop的地方只有兩個,就是對url進行去重和排序。這個項目持續(xù)了一年多,大部分的時間我還是在實現(xiàn)業(yè)務(wù)邏輯。
此時“大數(shù)據(jù)的概念”在國內(nèi)慢慢熱起來了,使我更堅信了”hadoop值得依賴”。
1.我把當(dāng)時中文論壇關(guān)于Hadoop相關(guān)的技術(shù)貼都過了一遍。
2.精讀了Pro Hadoop 一書。
3.蹲點百度知道好一陣子,專挑Hadoop帖子回答,賺了不少積分。
4.在計算機科雜志上發(fā)表了一篇關(guān)于mr優(yōu)化的文章。
這一年多的積累讓我真正在Hadoop這個領(lǐng)域入門了。
Hadoop平臺初建
2012年國內(nèi)大規(guī)模使用Hadoop的公司還不算多,我知道自己此時最需要的是一個平臺,更專注的去做一些事情。并不是每個人都那么幸運,而我很幸運的在那時加入現(xiàn)在的公司,很幸運的跟到了一個好leader。又碰巧公司在這個時候需要重新規(guī)劃一個更大且開放Hadoop集群(150節(jié)點),很幸運的這個事情是交由我來負責(zé)。
7月-8月:調(diào)研安全開放的Hadoop集群方案
9月:制定開放流程、用戶手冊,使用規(guī)范,集群機房遷移
10月份:集群正式對外開放運營
在Hadoop開放的頭一個月里,我開始接觸平臺用戶,和大伙慢慢熟悉起來,大伙遇到Hadoop的問題都會先來問我,把我當(dāng)成了”Hadoop專家”。其實在那之前,積累的個人實戰(zhàn)經(jīng)驗還是比較匱乏的。懂得就回答,不懂的我就查閱資料,跟蹤源碼,也許就是這種”羅森塔爾效應(yīng)”,讓我的Hadoop技術(shù)得到快速的成長。
Hadoop平臺運營
在2013年的Hadoop平臺運營過程中:
懂得了用戶需要引導(dǎo),培訓(xùn)的;
懂得了流程規(guī)范有時候可以繞開技術(shù)難題;
懂得了監(jiān)控報警多多益善;
懂得了技術(shù)也是需要運營;
學(xué)會了培養(yǎng)用戶信任感;
學(xué)會透過用戶的描述找到真正的需求;
學(xué)會了用計算投入產(chǎn)出比來做決策;
學(xué)會了對用戶只講困難不做拒絕;
了解了每個人做事的風(fēng)格特點。
方法論
2014年我們將Hadoop平臺的成功經(jīng)驗借鑒到日志系統(tǒng)、Storm集群、kafka集群、Spark集群、統(tǒng)一監(jiān)控系統(tǒng)、Hbase集群。讓我體會到了很多道理都是相通的,確實是有方法可以總結(jié)的,我們需要進行階段性的自我思考和總結(jié),搭建維護一套屬于自己的方法論。
技術(shù)分享
技術(shù)分享一方面是為了分享經(jīng)驗,另一方面也是促使自我思考,總結(jié),加深理解。
2012年7月份我第一次參加easyhadoop講座,聽大師們的分享,我內(nèi)心就自我暗示,需要跟他們交流,需要加入這個組織。
9月份我將兩個多月的研究成果總結(jié)成一個主題在easyhadoop另一次講座上給大家做了分享,這是我職業(yè)生涯的第一次對外分享。
之后一有新的研究成果我都會找機會參加講座進行分享,結(jié)識業(yè)界的牛人并進行交流。
這兩年大大小小的主題也分享了10余次,每次分享的主題基本都不一樣,沉淀了不少知識,也培養(yǎng)了我的結(jié)構(gòu)性思維。
鼓勵大家在自己的領(lǐng)域?qū)ふ乙粋€可以交流的組織,有機會就去分享,犯錯是成長最快的方式。
鳴謝
總結(jié)這幾年,運氣一直很好,在恰當(dāng)?shù)臅r候做了對的事情,讓我成長了技術(shù),也積累了許多技術(shù)之外的寶貴經(jīng)驗。
感謝tuboo這些年帶我升級打怪,感謝小伙伴們杰出的成果讓我在外面能有牛逼可以吹,感謝老婆對我經(jīng)常熬夜加班的諒解!這一路來要感恩的人和事太多了!