大數(shù)據(jù)時代下的今天,企業(yè)在做決策時更加注重數(shù)據(jù)驅(qū)動,那些收集數(shù)據(jù)、分析數(shù)據(jù)并用于商業(yè)決策的公司,相對于傳統(tǒng)企業(yè)更有競爭力。CA Technologies曾經(jīng)做過一項面向全球的調(diào)查,調(diào)查顯示,高達(dá)90%的公司認(rèn)為大數(shù)據(jù)能對他們帶來好處。
大數(shù)據(jù)不是一拍腦門說做就做的,單純的收集數(shù)據(jù)只能稱之為海量數(shù)據(jù),要想利用大數(shù)據(jù)獨(dú)占鰲頭走向巔峰,還要注意以下幾點(diǎn)。
以短期考慮促進(jìn)長期考慮
一切都瞬息萬變,很多人擔(dān)心跟不上大數(shù)據(jù)的潮流,因此無從知道今年或明年哪些工具、平臺或方法是最好的。別擔(dān)心, 這種快速演變的形勢可以為您服務(wù)。
每年,供應(yīng)商都在大數(shù)據(jù)使用方面不斷提高。 關(guān)系與在線交易系統(tǒng)(OLTP)會越來越高效、越來越智能,無論是在內(nèi)部還是云中運(yùn)行。 技術(shù)的發(fā)展將會緩和 Hadoop 及數(shù)據(jù)倉庫之間的關(guān)系。 而且,始終會有產(chǎn)品上市,更精準(zhǔn)地滿足您的具體需求。
因此,對采納新產(chǎn)品保持開放心態(tài),只要這些產(chǎn)品能提供足夠價值,就能名正言順地融入現(xiàn)有環(huán)境,保持能夠直連多種格式的商業(yè)智能平臺。
Hadoop還是數(shù)據(jù)倉庫 不難選
數(shù)據(jù)倉庫用來壓縮重要結(jié)構(gòu)化數(shù)據(jù)再適合不過,還能把數(shù)據(jù)存儲在商業(yè)智能工具和儀表板能夠輕松找到的地方。 但其弱勢是,分析過程與某些類型的轉(zhuǎn)換較弱且慢。
而Hadoop正好彌補(bǔ)數(shù)據(jù)倉庫的缺點(diǎn),雖然Hadoop在交互式查詢與數(shù)據(jù)管理方面較為弱勢,但其善于快速容納原始、未結(jié)構(gòu)化的復(fù)雜數(shù)據(jù)。因此,不要在選擇 Hadoop 還是數(shù)據(jù)倉庫這個問題上不知所從,兩者并不是對立的,而是相輔相成共生的關(guān)系。
獲取數(shù)據(jù)應(yīng)有底線
大數(shù)據(jù)對人類有這大作用,我們可以利用大數(shù)據(jù)找尋出我們所需要的,但要在法律所認(rèn)可的前提下。
目前,80 多個國家有數(shù)據(jù)隱私法。歐盟規(guī)定了七個“安全港隱私原則”,用以保護(hù)歐盟公民的個人數(shù)據(jù)。 在新加坡,個人數(shù)據(jù)保護(hù)法于 2013 年 1 月生效。 在美國,《薩班斯·奧克斯利法案》讓所有上市公司均須公開通告,而《健康保險隱私及責(zé)任法案》(HIPAA)則設(shè)立了醫(yī)療隱私的國家標(biāo)準(zhǔn)。我國也一直在積極完善關(guān)于隱私方面的法律法規(guī)。因此,潛入大數(shù)據(jù)的海洋之前,務(wù)必嚴(yán)肅看待遵守治理與隱私標(biāo)準(zhǔn)的需要。
有效的利用才能形成更大的數(shù)據(jù)
大數(shù)據(jù)是對海量數(shù)據(jù)的分析,而海量的數(shù)據(jù)需要千千萬萬的不起眼的小數(shù)據(jù)組成,每個數(shù)據(jù)集本身可能提供價值。 綜合起來,則能夠提供大價值。
舉例而言,在消費(fèi)品行業(yè),只有混合了消費(fèi)者信心數(shù)據(jù)與購買數(shù)據(jù)后,高層管理才能全面理解消費(fèi)行為。
價值大部分歸屬于混合了關(guān)系、半結(jié)構(gòu)化與原始數(shù)據(jù)的機(jī)構(gòu)。無論數(shù)據(jù)是在電子表格、數(shù)據(jù)庫、數(shù)據(jù)倉庫、類似 Hadoop 的開放式源文件系統(tǒng)中,還是以上都有,都需要能夠靈活快速地連接到數(shù)據(jù)并進(jìn)行整合。