當前,隨著信息大爆炸時代的發展,云計算、大數據成為大家津津樂道的熱門名詞。無論是消費、金融、電信、交通,甚至是政治、慈善等等地方幾乎都可以看到大數據的身影。大數據分析,也得到大眾的認可和追捧。
與此同時,我們也要理性看待大數據,大數據是人類發展的得力助手,但并不是阿拉丁神燈,能滿足人們的各種需求,大數據核心不在數據有多龐大,而是它蘊含的是計算和思維方式的轉變,因此對于大數據可能常常會有一些疑惑。
大數據是新時代產物?
追溯數據分析的發展,早在1887年,美國統計學家赫爾曼·霍爾瑞斯為了統計1890年的人口普查數據發明了一臺電動器來讀取卡片上的洞數,該設備讓美國用一年時間就完成了原本耗時8年的人口普查活動,由此在全球范圍內引發了數據處理的新紀元。
可見數據分析一點也不新,其概念誕生已久,只是在近些年才大熱而已。于過去相比,現在的科技更發達,通過網絡,通過可穿戴設備等等每天收集著海量數據,數據的處理更依賴計算機,但最后的分析與解讀人要人類完成。
多大才稱得上大數據?
數據量到底多大才能叫大數據并沒有嚴格的劃分,大數據的“大”是宏觀多變的意思,并是不指單純的大小。大數據應該從其背后蘊含的大價值來理解,因為數據已經很多了,人類利用分析數據的能力很強了,我們能從數據當中發現以前不能發現的價值這個角度來理解。
統計出的數據絕對客觀?
雖然數據都是有計算機在采集處理,但是也不可能做到絕對客觀,計算機只是在按照程序機械的采集,比如在某寶上,銷量高的商品不代表真的賣出去了,因為像那種只有一個商品銷量奇高的店,99%都是刷單的結果。人的行為很復雜,絕對客觀的統計本就很難,就更不要說沒有感情的機器在統計,因此,對于大數據我們可以說它是相對客觀的。
數據可以告訴我們不知道的內幕?
數據能告訴我們的只有數據,想要知道數據背后的內幕,則需要分析人員不僅僅單純的統計數據,更要了解數據之間的關聯進行分析和總結。
幾年前,谷歌的一個研究小組在科學雜志《自然》上宣布其可以追蹤美國境內流感的傳播趨勢,而這一結果僅利用谷歌搜索隱形的熱門關鍵字便作出了結論。但在運行了十幾個冬天之后,谷歌的預測比實際情況要夸張一倍。
究其原因,是因為谷歌不知道搜索關鍵詞和流感傳播之間到底有什么關聯。谷歌的工程師們沒有試圖去搞清楚關聯背后的原因。因此僅通過數據要找出事件背后的內幕是很困難的。
大數據是資訊部門的問題?
大數據的收集與儲存,的確可以歸類為資訊部門的業務。但定義該收集什么,如何收集,收集后該如何應用,絕對是業務主導部門該負責的。要求 IT 部門把大數據做好,就好像要求財務部門提昇公司獲利一樣,是本末倒置的。
未來大數據可以改變一切?
關于大數據的作用以及溢美之詞早已泛濫于網絡,似乎給了人們一種“大數據無所不能”的感覺。但大家可能有所忽視,大數據是對過去與發生的事情進行總結,其本身是沒有創新性的,所以對于不同領域,不同項目必須要根據具體問題具體分析解決。大數據角色應該是我們工作生活的得力助手而非主宰。
D1Net評論:
大書架,對于我們而言是如此的迷人,盡管迷人,但機器終究是機器,它無法取代人類的思考。就像基于數據和規則的人工智能始終無法取代具有創造性的人腦一樣,大數據時代提供給我們的將是更快的運算、更豐富的數據分析結果,但如何使用,關鍵還在于我們自己。