咨詢顧問公司Ovum的高級分析師Tony Baer最近發表了一篇博客,深入探討了EMC的Hadoop策略,作為大數據時代下的“標配”技術,一方面客戶的需求迫在眉睫,另一方面市場中越來越多的軟件或者服務提供商都為用戶提供了相應的解決方案,客戶究竟該如何選擇?Tony Baer用一定的篇幅介紹了目前企業中運行Hadoop的六種方式,相信能夠為您提供一些思路。
1.尋求云計算服務提供商。目前有許多云服務提供商已經為你搭建好了基礎架構,你只要按需購買服務即可享受到Hadoop的服務,比如微軟Azure,他們在年初的時候就開通了Hadoop服務HadoopOnAzure。
2.尋求簡單實用的中介。比如在DynamoDB服務的上Amazon Elastic MapReduce。
3.通過SaaS方式運行Hadoop應用(比如社交網絡分析、智能電網服務等)。這種方式比較適合中小型企業,以及那些有特定需求的企業或部門。
4.購買平臺化的軟件。像IBM等廠商都已經推出了比較成熟的軟件平臺(BigInsights,Stream),其中都提供了相關的Hadoop功能,你需要做的就是找一個靠譜的、有Hadoop經驗的系統集成商來為你進行部署。
5.購買一體化的解決方案。目前大型廠商都在推廣他們的一體化集成解決方案,我們簡單地稱其為“一體機(Appliance)”。這些一體機中集成了Hadoop功能,比如Oracle的大數據機(Big Data Appliance)和EMC的Greenplum DCA。這種方式比較適合與財大氣粗的大型企業,因為不是每個公司都能支付這樣昂貴的費用。
6.圍繞Hadoop基礎架構一點點構建解決方案。除非你是Cloudera或者Hortonworks這樣的Hadoop巨鱷,他們的業務能夠捆綁并支持核心的Hadoop平臺,否則還是需要一點一點地構建你的解決方案,包括框架、算法等等。
這六種方式都可以讓你啟動你的Hadoop,你更傾向于哪一種呢?歡迎通過評論或者微博互動的方式告訴我們你的答案。