如今所有人都在談論大數據,但事實上,關于它很多的言論都太過夸張。就業數據顯示,大數據似乎很為企業招聘者所需要。然而,更多的數據表明,企業并不知道要利用這些大數據專業人才做些什么。
然而,比大數據本身更重要的是大數據的分析和管理。而這一潮流正讓服務器自動化配置系統工具大量涌現。Puppet等就是支撐“DevOps”潮流的背后力量。
正如Dice.com數據所展示的那樣,Puppet是一種潮流,因為它給企業提供了一種更加簡便的方式來管理一定規模的IT基礎設施。這些基礎設施要不被叫做“大數據”,要不被叫做聽起來很傻的“服務器運營維護”。
Puppet在幕后操縱一切
專注于科技人才的Dice.com在追蹤科技專業就業市場的起伏方面,可謂是一個精準的晴雨表。這可不是通過Google搜索引擎還是什么其他的軟因素來測定它的,因為Dice已經追蹤了約8萬個每天在Dice.com上貼出的職業。然后它每年都會根據各職位在公開招聘上出現的次數來確定前十個“殺手锏”工作技能。
根據最新的Dice報告,Puppet是如今的幕后操縱者。下面讓我們看一看“發展最快的工作技能”的Dice表格。
在這些數據里,有兩樣是極其突出的:
不管大數據及其相關技術有多么熱門,IT管理這個老市場風采依舊。
Puppet使得大數據成為現實。潛藏在所有數據后的都是服務器,而服務器都需要被管理。Puppet使管理一定規模的服務器更加簡便,并且它和Bigtop一樣,已經是Hadtoop相關管理工具中的“一把手”了。
DevOps的贊成者Sean Carolan在Twitter上指出:不管公司是否公開將自己定義為“大數據”運營商,他們都開始意識到“要么自動化要么死”。“在這樣一個軟件分發不停的時代,這種自動化根本不會停止。”雖然如今Puppet與Chef,Ansible和Salt之間有著激烈的競爭,但它已經成為了市場領導者。
Puppet Lab的CEO Luke Kanies(也是Puppet的創始人)對數據的解釋時說道:
Puppet所在的領域——自動化——和其他的領域是不一樣的,這很難比較。所有的公司都一直在做數據庫,所以NoSQL既被這個傳統幫助著,也被這個傳統阻礙著。不管愿不愿意,從根本上來說,他們是一個可以互相替換的產業。
有了Puppet,我們就彌補了這一缺陷。許多使用Puppet的人都不必再人工地干一些諸如編寫自定義腳本這樣的事兒,他們可以使用具有更廣市場和更好生態系統的自動化技術。他們不用終止任何程序,也不用丟棄任何現存的技能,所以從人文角度來看,這也是更加簡便的。再說IT管理市場越發的膠著,所有企業都知道這些問題非解決不可了——Puppet能滿足你基本的需要,而不是作為一個更好的方法來取代你以前的習慣。
Kanies列舉了Puppet會更加火爆的幾大理由。但它真的能做的比大數據還大嗎?
Puppet與大數據之間的較量
自動配置管理市場正處于發展初期,來勢洶洶,它還有大量的發展空間。Puppet高居Dice.com榜榜首只不過表明了它的發展基數小而已。
再說了,事實上Dice.com的數據也沒和Indeed.com提供的就業數據完全一致。
Indeed.com追蹤了來自1000多家網站的職位信息,包括Dice.com。所以在分析就業趨勢方面,Indeed.com擁有更全的數據庫。Indeed.com的數據表明,在公開招聘方面,大數據和Hadoop的規模要比Puppet大得多:
即便在相對增長方面——這也正是Dice.com在意的——也是Hadoop和NoSQL遙遙領先。
然而,這也不是全部的現狀。舉個例子來說,Hadoop也不是一個單獨的網站。它是一個技術系統,接收從Hive(一種便于查詢和管理大型數據集合的分布式存儲系統)到Hbase(一種鍵-值數據存儲系統)到Pig(一個分析大數據集的平臺)到一系列一直在進化、擴張的所有科技數據。
其實“NoSQL”也一樣,只不過數據庫之間的差別要比相似點明顯不少。一個文檔數據庫就和一個鍵-值數據存儲區很不一樣。發布一個通用的“NoSQL”數據庫作業其實意味著企業根本不知道他們需要什么。廣而言之,所有需要“大數據”專業知識的人都和這些企業一樣茫然。
Puppet讓大數據不再是空談
和大數據共事的企業未必知道他們成功的秘訣是什么。正如我以前所寫的,Gartner在這方面的數據非常明確:所有人都知道他們需要用“大數據”來干些事情,但是怎么做或者做什么仍然是個謎。
不出意外,真正采用大數據的企業總在媒體炒作之后才開始,這和451 Research的分析師Michael Coté在這個有關大數據存儲使用的圖表中所做的詳細說明驚人地一致:
雖然公司仍在探索大數據區域,他們也逐漸發現更有效地管理基礎設施是多么必要。Puppet就是幫助你“如何”管理基礎設施的工具——或者說,最最關鍵的就是這個“如何”。
實際上,只要你明白基本所有和大數據有關的公開招聘都或多或少有些嘩眾取寵,那么你就很容易認為Dice.com和Indeed.com之間明顯的數據差異是合理的。各個組織都不知道他們到底需要什么,只知道他們得用大數據做一些有意義的事,所以他們也只是試著雇傭這方面的人才。
然而,當他們在尋找Puppet專長的人才時,同時也會知道他們到底需要什么——即幫助配置和管理一大群服務器的工具。雖然那些服務器最終也會被叫做“大數據”,但無論他們有什么時髦的名字,他們都需要被管理。