現(xiàn)如今,大數(shù)據(jù)仍然不算普及,但并不代表大數(shù)據(jù)是沒有意義的技術(shù),其價(jià)值及分析結(jié)果已經(jīng)令很多企業(yè)家垂青。企業(yè)都在開始嘗試?yán)么髷?shù)據(jù)來增強(qiáng)自己的企業(yè)業(yè)務(wù)競爭力,但是對于大數(shù)據(jù)分析行業(yè)來說,這技術(shù)仍然處于快速成長的初期,這領(lǐng)域仍有很多未定型的技術(shù)範(fàn)疇,潛能可謂無法預(yù)視。
現(xiàn)在企業(yè)最想知道的,應(yīng)該是緊貼發(fā)展趨勢吧。以下有五項(xiàng)技術(shù)趨勢,CIO會(huì)更了解如何時(shí)署合適自身業(yè)務(wù)的大數(shù)據(jù)方案:
1.基于云的大數(shù)據(jù)分析
Hadoop是用于處理大型資料集的一個(gè)框架和一組工具,這個(gè)最初設(shè)計(jì)在物理機(jī)上工作,但是目前這種現(xiàn)象已經(jīng)改變,越來越多的基于云的數(shù)據(jù)處理技術(shù)出現(xiàn),例如Amazon AWS的Elastic MapReduce (EMR),Google BigQuery中的資料分析服務(wù),IBM的Bluemix云平臺(tái)等等,這些都是基于云的大數(shù)據(jù)分析平臺(tái)。
就目前而言,大數(shù)據(jù)的分析工作正開始向公用云遷移,因?yàn)榇髷?shù)據(jù)分析需要一個(gè)安全、穩(wěn)定、可靠的審計(jì)環(huán)境。目前已經(jīng)有很多公司開始跟云服務(wù)公司合作,希望得到一個(gè)能夠橫跨多個(gè)部門的云平臺(tái)來支援公司的業(yè)務(wù)資料分析。隨著云平臺(tái)成本的降低,這個(gè)趨勢將越發(fā)明顯,部署大數(shù)據(jù)已經(jīng)不再是大企業(yè)專利。
2.Hadoop:新的企業(yè)資料作業(yè)系統(tǒng)
Hadoop分散式的分析框架,如今正在演變成分散式資源管理器,它可能將是資料分析的一個(gè)通用作業(yè)系統(tǒng)。有了這些系統(tǒng),你可以將不同的資料操作和分析操作插入到Hadoop分散式存儲(chǔ)系統(tǒng)中來執(zhí)行。由于SQL、MapReduce,在記憶體中,串流處理、圖形分析和其他類型的工作負(fù)載都能夠在 Hadoop上有足夠的性能運(yùn)行,越來越多的企業(yè)將會(huì)使用的Hadoop作為企業(yè)資料中心。
3.更多的預(yù)測分析
隨著大數(shù)據(jù)的發(fā)展,分析師不僅會(huì)累積更多的數(shù)據(jù)一起工作,而且還將處理大量許多屬性的工具。但是隨著大數(shù)據(jù)行業(yè)的發(fā)展,針對舊資料的分析更多的是為了提供預(yù)測的功能,畢竟人們更希望利用已有的資料來對未來預(yù)測有利的用途。
4.更多,更好的NoSQL
替代傳統(tǒng)的基于SQL的Relational Database的產(chǎn)品被稱為NoSQL,如今開始在特定種類的分析應(yīng)用程式中普及。以這一增長趨勢估計(jì),預(yù)計(jì)未來將有15至20個(gè)開源的NoSQL資料庫共同存在,他們各自有專長,這些資料庫會(huì)得到快速的發(fā)展。
5.在記憶體分析
使用記憶體來加快分析處理的技術(shù)如今越來越受歡迎,實(shí)時(shí)分析是很多企業(yè)使用者都喜歡的產(chǎn)品,目前很多基于記憶體的分析管理工具以及出現(xiàn),其中以亞馬遜的HANA一體機(jī)尤為明顯。
D1Net評論:
數(shù)據(jù)分析是一個(gè)熱門行業(yè),未來有很大發(fā)展的空間,所以目前很多廠商都針對大數(shù)據(jù)分析領(lǐng)域推出產(chǎn)品,但是對于企業(yè)使用者來說,在選擇產(chǎn)品的時(shí)候要注意,由于目前資料分析尚沒有到達(dá)成熟的市場時(shí)期,所以市場上的分析工具參差不齊,在選擇產(chǎn)品的時(shí)候還是要選擇知名品牌為好。