1、數(shù)據(jù)處理和分析的差異
人們如果想要得到精準的結論,需要建立模型來描述問題,同時,需要理順邏輯,理解因果,設計精妙的算法來得出接近現(xiàn)實的結論。因此,一個問題,能否得到最好的解決,取決于建模是否合理,各種算法的比拼成為決定成敗的關鍵。然而,大數(shù)據(jù)的出現(xiàn)徹底改變了人們對于建模和算法的依賴。人們發(fā)現(xiàn),當數(shù)據(jù)量不斷增大時,許多數(shù)據(jù)運行結果可以不依賴算法就可以自然產生。當數(shù)據(jù)越來越大時,數(shù)據(jù)本身(而不是研究數(shù)據(jù)所使用的算法和模型)保證了數(shù)據(jù)分析結果的有效性。同傳統(tǒng)的數(shù)據(jù)分析模式相比,大數(shù)據(jù)即便缺乏精準的算法,只要擁有足夠多的數(shù)據(jù),就能得到接近事實的結論。
2、對事物反映程度的差異
我們在使用搜狗拼音輸入法時,文字備選項中的文字并不是固定不變的。而是利用搜狗數(shù)據(jù)庫中收集的所有用戶的用詞習慣進行比較推薦排序。搜狗檢查所有用戶的使用習慣,將最常用、出現(xiàn)頻率最高的字、詞、短語等推薦給用戶,同時根據(jù)每個人的不同習慣進一步細化,打造更加貼近用戶的輸入環(huán)境。在這一過程中,計算機可以并不了解問題的邏輯,但是當用戶行為的記錄數(shù)據(jù)越來越多時,計算機就可以在不了解問題邏輯的情況之下,提供最為可靠的結果。可見,海量數(shù)據(jù)和處理這些數(shù)據(jù)的分析工具,為理解世界提供了一條完整的新途徑。
3、數(shù)據(jù)來源和組合的差異
只要有數(shù)據(jù)的產生,就能成為大數(shù)據(jù)的來源,大數(shù)據(jù)包含數(shù)字類的結構化數(shù)據(jù)和文本、圖片、音視頻類的非結構化數(shù)據(jù),其數(shù)據(jù)密度相對較低,來自各種渠道的數(shù)據(jù)通過互聯(lián)網(wǎng)適時傳輸,都可以匯集到大數(shù)據(jù)的中心。傳統(tǒng)數(shù)據(jù)需要前期進行有序化處理,并記錄在相應的數(shù)據(jù)庫中,數(shù)據(jù)歸集對象類型單一,綜合分析功能差。
4、數(shù)據(jù)傳播面和應用面的差異
信息時代由于各類數(shù)據(jù)的發(fā)布、共享與應用方式的多樣性,數(shù)據(jù)的可獲得性極大增強,各種新的應用技術在不斷的創(chuàng)新演進,以省為單位的大數(shù)據(jù)、云計算的分析交易平臺的搭建,使得大數(shù)據(jù)的應用前景十分廣闊。(谷尼大數(shù)據(jù))