“在中國,歷史上哪一個時代的宦官是可以娶妻的?這是非常嚴肅的知識。如果專門研究宦官,把他們的生存狀況、心理狀態以及他們在中國歷史上的地位、影響、作用都搞明白,你將會成為一名了不起的專家。可是假如你的主要精力不在此,這樣的知識碎片,對你一點用都沒有。”《百家講壇》著名講師、上海開放大學教授鮑鵬山在前不久的一次演講中,舉例說明當知識不成體系時,它只是無用的碎片。
數據、信息也是知識的表現形式,這讓我想到已經火了很久的大數據。5月26日,馬云在貴陽國際大數據產業博覽會上表示,未來最大的能源是大數據,很多追隨者更堅信大數據就是生產力。維克托·邁爾·舍恩伯格在其《大數據時代》中指不用隨機分析法(抽樣調查)這樣的捷徑,而采用所有數據進行分析處理。數據類似知識,沒有處理和分析,只是簡單的0和1。
我們的生活本來就不可能占有無限的數據,數據本身是一種資源,大數據可以是有很大價值,也可能是垃圾信息。在成為生產力的道路上至少需要收集、挖掘和分析。數據收集和匯總只是初級層面的工作,挖掘和分析才是大數據價值的體現。
舍恩伯格在去年大連軟交會上演講時,向觀眾展示了一張4歲兒子的照片,他表示用相機給孩子拍一張照片也是大數據的收集。收集的過程中可以聚焦孩子,也可以聚焦孩子普遍的牙刷,這是數據的刷選。“在收集數據時進行選擇,就需要區分什么是重要的,什么是不重要的,但是很多時候我不知道什么是重要的,什么是不重要的。這種情況下,有選擇就會有數據丟失。”
隨著各種傳感器的廉價化和普及應用,數據的收集開始變得容易。例如人們手中的智能手機,城市各個角落的監控攝像頭,以及我們在互聯網上的社交、購物和游戲等,都會成為生產數據,并被收集。
大數據的挖掘分析才是大數據價值應用的核心。正如雷軍所言,“全行業的關鍵點是怎么探索數據的價值,怎么挖掘大數據時代的商業模式。這是我們今天的當務之急”。
從技術角度而言,數據挖掘是一類深層次的數據分析方法。數據挖掘通過預測未來趨勢及行為,作出前攝的、基于知識的決策。
現在,由于各行業業務自動化的實現,商業領域產生了大量的業務數據,這些數據不再是為了達到分析的目的而收集的,而是由商業運作產生的。分析數據更主要的是為商業決策提供真正有價值的信息,進而獲得利潤。
馬云相信,未來所有的制造業都將成為互聯網和大數據的終端企業,數據將取代石油,成為未來制造業最大的能源。
你們信嗎?反正我是信了。