Gartner的Symposium/ITxpo會(huì)議上談到,當(dāng)大數(shù)據(jù)變得常見就會(huì)正常化,而作為IT專業(yè)人士在2020年大數(shù)據(jù)或變得正常化。
企業(yè)首席信息官們可以通過從大數(shù)據(jù)謊言中區(qū)分出實(shí)際需求的事實(shí),來幫助他們的企業(yè)一步步走向正常。Gartner分析師Mark Beyer提出八個(gè)大數(shù)據(jù)“神話”:
1.100TB以上屬于大數(shù)據(jù)
就大數(shù)據(jù)而言,是對(duì)數(shù)據(jù)的處理,而非數(shù)據(jù)的大小,企業(yè)不要再去尋覓大數(shù)據(jù)標(biāo)準(zhǔn)尺寸,因?yàn)榇髷?shù)據(jù)并沒有標(biāo)準(zhǔn)尺寸。
2.大數(shù)據(jù)需更換基礎(chǔ)設(shè)施
如果企業(yè)因?yàn)橛行碌男枨缶蜎Q定改變整個(gè)基礎(chǔ)架構(gòu),分析師Mark Beyer表示企業(yè)是把之前所有的東西都當(dāng)做賭注。對(duì)于CIO而言,IT基礎(chǔ)設(shè)施成熟度犧牲的風(fēng)險(xiǎn)是否值得。
3.80%數(shù)據(jù)是非結(jié)構(gòu)化
從數(shù)據(jù)上看,結(jié)構(gòu)化和非結(jié)構(gòu)化被經(jīng)常引用大數(shù)據(jù)統(tǒng)計(jì),但根據(jù)Beyer所談最大的信息資產(chǎn)是機(jī)器數(shù)據(jù),其并未相互關(guān)聯(lián)說它們非結(jié)構(gòu)化是絕對(duì)的謊言,而機(jī)器數(shù)據(jù)是結(jié)構(gòu)化的數(shù)據(jù),通常也是重復(fù)的信息。
4.工具將取代數(shù)據(jù)科學(xué)家
對(duì)于數(shù)據(jù)科學(xué)家,工具是一種工程,是對(duì)已經(jīng)發(fā)現(xiàn)的事實(shí)的重復(fù)利用。而科學(xué)是去發(fā)現(xiàn)新的事實(shí),所以工具不會(huì)取代數(shù)據(jù)科學(xué)家,至少在工具可以自行復(fù)制和發(fā)展之前不會(huì)。
5.海量數(shù)據(jù)解決質(zhì)量問題
Gartner分析師Mark Beyer認(rèn)為:“數(shù)據(jù)質(zhì)量越低,答案質(zhì)量就越低”。企業(yè)CIO們應(yīng)該關(guān)注數(shù)據(jù)質(zhì)量,通過手機(jī)收集的氣質(zhì)地理定位數(shù)據(jù)為例,有些人把手機(jī)等同于真實(shí)的個(gè)人,但對(duì)于數(shù)據(jù)質(zhì)量來說有可以被不小心留在辦公室,或者GPS功能可以在任何時(shí)間點(diǎn)被關(guān)閉。
6.實(shí)時(shí)只是速度更快而已
實(shí)時(shí)操作,并不意味著加快了當(dāng)前數(shù)據(jù)的處理和分析過程,而是確保數(shù)據(jù)收集和決策之間的間隔越短越好。此外,大多數(shù)企業(yè)數(shù)據(jù)是不需要實(shí)時(shí)操作的。
7.數(shù)據(jù)量優(yōu)于專業(yè)知識(shí)
對(duì)于大數(shù)據(jù)來說,那些認(rèn)為可以簡單地不再管業(yè)務(wù)流程的人,通常一位好的數(shù)據(jù)科學(xué)家并不能完全提供企業(yè)需求,如果沒有業(yè)務(wù)流程管理,數(shù)據(jù)科學(xué)家將不能提供商業(yè)價(jià)值,需要企業(yè)有效的區(qū)分業(yè)務(wù)管理和大數(shù)據(jù)應(yīng)用進(jìn)而產(chǎn)生商業(yè)價(jià)值。
8.數(shù)據(jù)模型沒有用
Gartner分析師Mark Beyer談到,數(shù)據(jù)模型沒有用這一論斷很絕對(duì)。任何數(shù)字資產(chǎn)里的東西都有其數(shù)字模型,企業(yè)不應(yīng)該因?yàn)榇髷?shù)據(jù)就舍棄模型。