大數(shù)據(jù)最核心的價值就是在于對于海量數(shù)據(jù)進(jìn)行存儲和分析。相比起現(xiàn)有的其他技術(shù)而言,大數(shù)據(jù)的“廉價、迅速、優(yōu)化”這三方面的綜合成本是最優(yōu)的。
當(dāng)這項技術(shù)在自己用的時候,自己將會非常收益,因為成本會降低;當(dāng)這項技術(shù)作用在客戶時候,客戶同時也會受益。能夠讓客戶和自己同時受益的技術(shù),就是最有商業(yè)價值的。所以,大數(shù)據(jù)并不只是喊口號的空話,而是像其他的新興技術(shù)一樣,商業(yè)化是需要一個過程,就現(xiàn)在看來,大數(shù)據(jù)還是屬于雷聲大雨點小的階段,所以讓很多人會去認(rèn)為大數(shù)據(jù)炒作的嫌疑更大。
雖然大數(shù)據(jù)并不是僅僅局限在技術(shù)的顯示,但是Hadoop系統(tǒng)的技術(shù)已經(jīng)在事實上獲得認(rèn)可了,因此,在討論大數(shù)據(jù)最核心的價值同時,也不能脫離Hadoop系統(tǒng)的技術(shù)。
一、海量
這是大數(shù)據(jù)里面最關(guān)鍵的一條,少量的數(shù)據(jù)在IT行業(yè)有許多解決方案,所以大數(shù)據(jù)技術(shù)并不占優(yōu)。
二、存儲
這里首先是需要很多存儲的技術(shù),其次數(shù)據(jù)的存儲設(shè)備需要有擴(kuò)展性,只要將存儲服務(wù)器的節(jié)點增加即可,將默認(rèn)的副本技術(shù)讓數(shù)據(jù)不丟失。
三、分析
海量的數(shù)據(jù)分析一定是需要進(jìn)行分布式處理的,不然時間成本太大。分布式技術(shù)很早就已經(jīng)有了,都很專業(yè)和復(fù)雜。Hadoop只需要讓分布式處理上運行幾十條或者上百條代碼即可完成,在專業(yè)程序上只需要很短的時間就可以完成基本的數(shù)據(jù)分析。當(dāng)然最專業(yè)的大數(shù)據(jù)分析還是需要專家還完成。
四、優(yōu)秀
Hadoop系列技術(shù)是專門為海量數(shù)據(jù)處理而進(jìn)行設(shè)計的,IT行業(yè)的頂級企業(yè)參與了貢獻(xiàn)和相關(guān)技術(shù)的貢獻(xiàn),在生態(tài)圈上具有完善的一套體系,所以各種需求都能夠基本滿足。相較于其余的分布式技術(shù),Hadoop則更加優(yōu)秀。
五、快速
1.在集群的處理上的性能,會隨著運算借點的增加而將線性進(jìn)行擴(kuò)展。
2.基于JAVA語言實現(xiàn),將學(xué)習(xí)的門檻大大的降低了。
3.對于集群的部署和維護(hù),變得越來越容易(有很多自動化的集群構(gòu)建和維護(hù)工具,包括許多商業(yè)版本,都提供web界面的運維功能)。
6、廉價
1.不需要購買IBM、Oracle、EMC等公司昂貴的硬件、軟件和服務(wù),也無需windows授權(quán)。
2.因為會這項技術(shù)的人或公司越來越多,購買或定制開發(fā)基于相關(guān)技術(shù)的商業(yè)產(chǎn)品越來越便宜
綜上,相對于其他技術(shù)體系,大數(shù)據(jù)的綜合成本最優(yōu)。