《企業網D1Net》9月24日訊
當前,大數據概念已經廣為人知,隨著大數據的關注熱度走高,關于Hadoop的爭論也沒有停止,與此同時對于開源傳奇Hadoop的謊言和質疑也隨之而來,俗話說“謊言猛于虎”,關于Hadoop的一些謊言不能隨便相信。
1.傳統SQL不可以在Hadoop上使用
當Facebook、Twitter、Yahoo!在Hadoop上豪賭時,他們同樣知道HDFS和MapReduce受限于處理類似SQL語言的能力,這也是最終得以孵化的原因。基于全球上大量的數據都是通過SQL來管理,一些公司和項目都在Hadoop和SQL的兼容上狠下功夫。
2.取代大型機!Hadoop是唯一的新IT數據平臺
在IT投資組合里有很多一直長期存在的投資,而大型機就是這么一個例子,與ERP、CRM和SCM這些系統一樣演變至今。而如果大型機不想被公司或者架構遺棄,它就必須展示在現有投資環境中的價值。而VMware的許多客戶在使用大型機上都遇到了速度、規模和開銷的問題,但是并不是沒有途徑去解決這些問題,比如像vFabric SQLFire這樣的內存大數據網絡就可以被嵌入或者使用分布式緩存途徑去解決類似隊列的高速攝取、促進大型機的批處理或實時分析報告這些問題。
3.虛擬化會導致性能下降
Hadoop最初的設計只是在實體服務器上運行,然而隨著越來越多機構的采用,許多公司都希望它能作為數據中心服務在云中運行。為什么這么多的公司都希望虛擬化Hadoop?
首先要考慮管理基礎設施的擴展性,VMware快速的認識到擴展計算資源,比如虛擬Hadoop節點,當數據和計算分開時會對性能有所幫助,否則如果你關閉某個Hadoop節點將丟失上面的所有數據或者添加一個沒有數據的空節點。而鑒于這個原因,許多來自MapR、Hortonworks、Cloudera和Greenplum的專業Hadoop發行版都支持Project Serengeti和Hadoop Virtualization Extensions(HVE)。
4.Hadoop只可以在數據中心運行
首先,存在SaaS云服務解決方案。許多云服務允許你云端運行Hadoop、SQL,這無疑可以幫助你省下數據中心建造投資的時間和金錢。對于一個公有云運行時,Java開發者可以從Spring Data for Hadoop以及一些其它的GitHub中的用例獲益。
5.Hadoop對虛擬化毫無經濟價值
Hadoop通常解釋在一堆商用服務器上運行,這樣就會有人認為添加一個虛擬層在帶來額外支出的同時并不會有額外的價值收益。用這個觀點看是存在缺陷的,你并沒有考慮到數據和數據分析事實上都是動態的。想成為一個利用Hadoop能量去成長、創新及創造效率的公司,你必須改變數據的來源、分析的速度等等。
虛擬化基礎設施同樣可以減少物理硬件的封裝,讓CAPEX直接等于純粹的商用硬件,而通過自動以及更搞笑的利用共享基礎設施同樣可以減少OPEX(運營成本)。
D1Net評論:
在Hadoop發展中,質疑聲是難以避免的,與之相伴的謊言和流言也是常見的,對于Hadoop的謊言,人們不能輕易相信,要有甄別意識,這就需要人們加強對Hadoop的了解,只有充分了解之后才能識破謊言,正確運用Hadoop的價值。