專家認(rèn)為,企業(yè)有沒(méi)有“大數(shù)據(jù)”能力,分析報(bào)告是否包含“大數(shù)據(jù)”成分,要看是否具備兩個(gè)特征:一是數(shù)據(jù)本身要具有一定規(guī)模,肯定不同于以前社會(huì)科學(xué)控制實(shí)驗(yàn)中幾十幾百人的規(guī)模;二是數(shù)據(jù)分析結(jié)果要能夠提供深刻洞見(jiàn),不是簡(jiǎn)單的統(tǒng)計(jì)分析。
近年來(lái),從技術(shù)界走出來(lái)的“大數(shù)據(jù)”逐漸受到社會(huì)各界的高度關(guān)注,在社會(huì)管理、企業(yè)營(yíng)銷、青年就業(yè)創(chuàng)業(yè)等方面都發(fā)揮出很大作用。但到底什么是“大數(shù)據(jù)”,很多人對(duì)此還有疑惑。同時(shí),“大數(shù)據(jù)”被迅速?gòu)V泛引用也引發(fā)人們對(duì)濫用的擔(dān)憂。
近日,中國(guó)青年報(bào)社會(huì)調(diào)查中心通過(guò)民意中國(guó)網(wǎng)和媒體對(duì)2315人進(jìn)行的一項(xiàng)調(diào)查顯示,43.6%的受訪者認(rèn)為“大數(shù)據(jù)”分析意義很大,但80.0%的受訪者也確認(rèn)自己不清楚什么是“大數(shù)據(jù)”,75.9%的受訪者發(fā)現(xiàn)目前存在“大數(shù)據(jù)”被濫用的現(xiàn)象。
80.0%受訪者不清楚什么是“大數(shù)據(jù)”
調(diào)查中,聽(tīng)說(shuō)過(guò)和沒(méi)聽(tīng)說(shuō)過(guò)“大數(shù)據(jù)”的受訪者各占一半。80.0%的受訪者直言不清楚什么是“大數(shù)據(jù)”,表示“非常清楚”和“比較清楚”的受訪者分別僅占8.3%和11.6%。
北京大學(xué)信息工程學(xué)院計(jì)算機(jī)應(yīng)用技術(shù)專業(yè)研一學(xué)生卿,這學(xué)期正在學(xué)習(xí)一門(mén)關(guān)于調(diào)研“大數(shù)據(jù)”的課程。談及如今的“大數(shù)據(jù)”熱,卿顯得有些激動(dòng)。他說(shuō),“大數(shù)據(jù)”可以幫助人們了解平時(shí)注意不到的信息,還可以預(yù)測(cè)未來(lái),比如可以根據(jù)機(jī)票漲降情況確定最佳購(gòu)票時(shí)機(jī),根據(jù)人們的搜索記錄更早地預(yù)測(cè)流感傳播。
卿表示,如今很多企業(yè)都在說(shuō)“大數(shù)據(jù)”,其中不乏“跟風(fēng)”現(xiàn)象。有些數(shù)據(jù)分析貼上“大數(shù)據(jù)”標(biāo)簽,瞬間就顯得“高大上”,其實(shí)并沒(méi)有真正的“大數(shù)據(jù)”分析。
統(tǒng)計(jì)學(xué)專業(yè)畢業(yè)的王京也認(rèn)為,現(xiàn)在有些標(biāo)榜“大數(shù)據(jù)”的報(bào)告,一方面數(shù)據(jù)量不大,另一方面也不是“大數(shù)據(jù)”的思維。“大數(shù)據(jù)”講究效率、針對(duì)個(gè)人,但很多類似于“大數(shù)據(jù)教你談戀愛(ài)”這樣的說(shuō)法,更多是一種噱頭。
調(diào)查中,75.9%的受訪者發(fā)現(xiàn)“大數(shù)據(jù)”存在被濫用的現(xiàn)象。
電子科技大學(xué)互聯(lián)網(wǎng)科學(xué)中心主任、《大數(shù)據(jù)時(shí)代》中文翻譯者周濤說(shuō),的確有一些企業(yè)在商務(wù)智能時(shí)代沒(méi)有學(xué)好商務(wù)智能,到了大數(shù)據(jù)時(shí)代才剛剛學(xué)會(huì)商務(wù)智能,就說(shuō)自己是“大數(shù)據(jù)”。
周濤認(rèn)為,一個(gè)企業(yè)有沒(méi)有“大數(shù)據(jù)”能力,一個(gè)分析報(bào)告是否包含“大數(shù)據(jù)”成分,要看是否具備兩個(gè)特征:一是數(shù)據(jù)本身要具有一定規(guī)模,肯定不同于以前社會(huì)科學(xué)控制實(shí)驗(yàn)中幾十幾百人的規(guī)模;二是數(shù)據(jù)分析結(jié)果要能夠提供深刻洞見(jiàn),不是簡(jiǎn)單的統(tǒng)計(jì)分析,譬如“某社交網(wǎng)絡(luò)1000萬(wàn)用戶中45%是男性”、“全國(guó)春運(yùn)最熱航線是北京到上海”,這些都不是“大數(shù)據(jù)”,只是非常簡(jiǎn)單的分析方法在稍微大一點(diǎn)的數(shù)據(jù)集上的應(yīng)用。舉個(gè)例子,通過(guò)分析春運(yùn)人口遷移路線、遷移方式(體現(xiàn)了經(jīng)濟(jì)水平)以及購(gòu)票人的身份證信息(體現(xiàn)了年齡和籍貫),來(lái)對(duì)中國(guó)勞動(dòng)人口的流動(dòng)現(xiàn)狀進(jìn)行刻畫(huà),并對(duì)未來(lái)中國(guó)勞動(dòng)力流動(dòng)與分布形態(tài)進(jìn)行預(yù)測(cè),這就有一點(diǎn)“大數(shù)據(jù)”的影子了。
王京覺(jué)得,我們的傳統(tǒng)比較偏重人文主義、缺乏數(shù)據(jù)思維,這些“大數(shù)據(jù)”的說(shuō)法雖然存在問(wèn)題,在專業(yè)性上過(guò)不了關(guān),但對(duì)于推廣數(shù)據(jù)化思維、養(yǎng)成用數(shù)據(jù)說(shuō)話的觀念是有意義的。
35.6%受訪者覺(jué)得一些“大數(shù)據(jù)”分析空有大量數(shù)據(jù)
南京大學(xué)計(jì)算機(jī)專業(yè)博士高坤(化名)說(shuō),現(xiàn)在“大數(shù)據(jù)”還存在很多問(wèn)題,比如數(shù)據(jù)的所有權(quán)問(wèn)題、隱私問(wèn)題、安全問(wèn)題等,都需要盡快解決。
周濤認(rèn)為,很多人分不清安全和隱私。安全問(wèn)題一直都有,主要是指攻擊方通過(guò)一些手段盜取信息或破壞信息。使用數(shù)據(jù)的企業(yè),在接觸敏感甚至涉密信息時(shí),應(yīng)該有安全資質(zhì)的認(rèn)證。這在我國(guó)的運(yùn)營(yíng)商體系和金融體系里都有明確要求。
“經(jīng)常和安全問(wèn)題混為一談的,是數(shù)據(jù)隱私的問(wèn)題。”周濤說(shuō),一方面,隱私數(shù)據(jù)直接泄露,或者有不法人士售賣這些信息,另一方面,一些隱私信息通過(guò)技術(shù)手段遭到破譯。這樣就可能給個(gè)人或商家?guī)?lái)傷害,比如一些招聘網(wǎng)站的個(gè)人求職信息被破譯之后,會(huì)對(duì)個(gè)人造成傷害,也會(huì)讓招聘企業(yè)無(wú)法阻斷信息,失去盈利空間。
“除去法律層面、道德層面,科學(xué)技術(shù)層面上也還有很多問(wèn)題需要解決。”高坤說(shuō),有這么多數(shù)據(jù),具體怎么處理,還需要更好地研究。現(xiàn)在很多“大數(shù)據(jù)”只是存儲(chǔ)下來(lái),缺少進(jìn)一步分析,但是把海量數(shù)據(jù)存儲(chǔ)下來(lái)本身也是技術(shù)進(jìn)步,是“大數(shù)據(jù)”工作的一部分。
王京說(shuō),一方面,沒(méi)有有效的方法來(lái)分析數(shù)據(jù),另一方面,很多平臺(tái)沒(méi)有打通,比如說(shuō)一個(gè)人上網(wǎng)不只買東西,還會(huì)聊天,聊天對(duì)買東西是有影響的,但是聊天的數(shù)據(jù)和買東西的數(shù)據(jù)無(wú)法對(duì)接起來(lái),無(wú)法產(chǎn)生商業(yè)價(jià)值。
調(diào)查中,35.6%的受訪者覺(jué)得現(xiàn)在一些“大數(shù)據(jù)”分析空有大量數(shù)據(jù),30.8%的受訪者認(rèn)為缺乏數(shù)據(jù)安全,11.1%的受訪者提出缺乏科學(xué)性,9.3%的受訪者指出分散數(shù)據(jù)沒(méi)有有效整合,7.8%的受訪者認(rèn)為存在“大數(shù)據(jù)”與傳統(tǒng)分析概念混淆的情況。
43.6%受訪者認(rèn)為“大數(shù)據(jù)”分析意義很大
調(diào)查顯示,43.6%的受訪者認(rèn)為“大數(shù)據(jù)”分析的意義很大,7.0%的受訪者認(rèn)為不太大,9.5%的受訪者覺(jué)得“大數(shù)據(jù)”分析沒(méi)什么意義,39.8%的受訪者表示不好說(shuō)。
90后北大研究生劉環(huán)是在一次講座上了解到了“大數(shù)據(jù)”。劉環(huán)認(rèn)為,“大數(shù)據(jù)”確實(shí)還存在很多問(wèn)題,但不可否認(rèn)生活、學(xué)習(xí)中的很多細(xì)節(jié)也因“大數(shù)據(jù)”而改變,比如現(xiàn)在用的翻譯工具越來(lái)越智能化,一些輸入法更人性化,這些都?xì)w功于“大數(shù)據(jù)”分析,相信“大數(shù)據(jù)”會(huì)有更大發(fā)展空間。
王京說(shuō),雖然“大數(shù)據(jù)”現(xiàn)在還在試驗(yàn)、探索階段,但是“大數(shù)據(jù)”很重要,跟我們每個(gè)人生活都息息相關(guān)。原來(lái)的數(shù)據(jù)生產(chǎn)是由專業(yè)機(jī)構(gòu)去做,現(xiàn)在我們每天都在生產(chǎn)數(shù)據(jù),只要有媒介的地方就會(huì)產(chǎn)生數(shù)據(jù)。“數(shù)據(jù)科學(xué)家的文本分析、行為分析,都是能帶來(lái)價(jià)值的,比如現(xiàn)在的微博、微信等,通過(guò)數(shù)據(jù)分析就能帶來(lái)商業(yè)價(jià)值”。
周濤表示,“大數(shù)據(jù)”分析的意義主要體現(xiàn)在:一、挖掘數(shù)據(jù)中潛藏的關(guān)聯(lián)關(guān)系甚至因果關(guān)系;二、對(duì)數(shù)據(jù)整體中缺失的信息進(jìn)行預(yù)測(cè);三、對(duì)數(shù)據(jù)所代表的系統(tǒng)走勢(shì)進(jìn)行預(yù)測(cè);四、支持對(duì)數(shù)據(jù)所在系統(tǒng)功能的優(yōu)化,或者對(duì)決策起到評(píng)估和支撐作用。
高坤認(rèn)為,“大數(shù)據(jù)”本身是一種新的科學(xué)手段,雖然目前還不成熟,但已經(jīng)開(kāi)始受到科學(xué)家的關(guān)注。“大數(shù)據(jù)”對(duì)于經(jīng)濟(jì)、國(guó)防,都是最重要的科技手段。青年應(yīng)該更多地關(guān)注科學(xué)技術(shù)的發(fā)展,從科技的角度來(lái)理解“大數(shù)據(jù)”。