研究人員與商業(yè)用戶等分析大數(shù)據(jù),是為了洞察客戶的真正需求。
數(shù)據(jù)有價值,公司離不開數(shù)據(jù),但是數(shù)據(jù)究竟有多值錢呢?分析大數(shù)據(jù)并從中獲取價值的成本到底有需要多少呢?
在過去,技術(shù)專家向高級管理層提供的是歷史數(shù)據(jù),以便他們能夠確定市場趨勢。統(tǒng)計數(shù)據(jù)盡管對在較高層次了解市場趨勢以及組織如何做市場很有幫助,但并不足以確定需要開發(fā)什么新產(chǎn)品或服務(wù)。這些統(tǒng)計數(shù)據(jù)不會告訴你客戶真正想要什么。
分析師,研究人員以及商業(yè)用戶分析大數(shù)據(jù)是為了更快更好地做出決定。通過采用諸如文字分析、機(jī)器學(xué)習(xí)、預(yù)測性分析、數(shù)據(jù)挖掘以及統(tǒng)計等先進(jìn)的分析技術(shù),企業(yè)可以分析之前未被開發(fā)的數(shù)據(jù)。
公司產(chǎn)生了大量數(shù)據(jù),也有能力通過其他來源收集信息,這些來源包括移動應(yīng)用、傳感器、網(wǎng)站、點擊流數(shù)據(jù)以及社交媒體活動等。這些數(shù)據(jù)可以變成產(chǎn)品。
收集和分析大量數(shù)據(jù),特別是非結(jié)構(gòu)化數(shù)據(jù),并不是一件容易的事。目前企業(yè)的系統(tǒng)配備無法處理每周500TB的數(shù)據(jù),所以沒有辦法挖掘到能幫助公司開發(fā)客戶所需的新產(chǎn)品和服務(wù)的金塊。這導(dǎo)致公司要尋求能解決問題的高性能計算資源,如天氣與氣候預(yù)報、參數(shù)化建模及隨機(jī)建模等來處理大規(guī)模的商業(yè)化數(shù)據(jù)。
大數(shù)據(jù)分析是利用分析技術(shù)對非常大規(guī)模且多樣性的數(shù)據(jù)集進(jìn)行分析,這些數(shù)據(jù)包括了結(jié)構(gòu)化/非結(jié)構(gòu)化、流數(shù)據(jù)或批處理數(shù)據(jù)等不同類型,且在規(guī)模上也差異很大,從TB到PB乃至ZB不等。它會檢查不同的數(shù)據(jù)類型以發(fā)現(xiàn)隱藏在其中的模式、未知的關(guān)聯(lián)以及其他有用的信息。
上述信息可提供對競爭對手的競爭優(yōu)勢,其結(jié)果是商業(yè)利益,如更有效的營銷以及收入的增加。高性能計算數(shù)據(jù)分析(HPDA)是用來描述數(shù)據(jù)密集型HPC市場及高端商業(yè)數(shù)據(jù)分析市場轉(zhuǎn)變的一個術(shù)語。