“大數據分析”這么高大上,媽媽怎么會懂呢?
不信?聽聽媽媽怎么說——會做飯就會大數據分析!
那么問題來了?做飯和大數據有什么關系呢?請聽下面分析:
第一階段:
菜地里的毛菜(原始系統的數據,有錯誤,不精準,毛菜有泥巴,有黃葉子),相當于ERP,PDM系統里面的原始數據。
第二階段:
從菜地里采集到家,分門別類的堆在一起(初步去掉泥巴,黃葉子,分類堆放),相當于從原系統到ODS,ODS的意思是操作數據,即原始系統中的操作數據的一個副本,與原始數據是一模一樣的,叫貼源,這個過程就叫數據采集、清洗、轉換,即ETL干的事情,這個階段叫初加工。
第三階段:
把拿回家的各種菜洗凈,去皮,按大小分類,去掉小的、爛的蔬菜,可以賣給超市了,對BI項目來說,就是從ODS到數據倉庫的過程,數據的精加工過程,去偽存真,也要用到ETL來清洗轉換,對缺項的數據補充完整,比如合并數據,合并字段,增加主數據描述字段,補充分類等。
第四階段:
從菜農賣到超市,超市還要經過一次加工,比如包裝成一小包一小包的,把蔬菜放在一起,水果放在一起,便于顧客直接購買,這一步就是從數據倉庫到數集市的過程,數據集市就是包好、稱好的凈菜,價簽已經打好的了,顧客直接付款可以拿走了,從數據倉庫到數據集市就是形成一個一個的數據立方體,這個立方體的數據是加工好的,可以單獨發布出去,離線使用,相當于一個execl數據文件,你可以用EXECL工具打開,也可以用WPS打開,打開以后,可以用表格表示,也可以用圖表表示。
第五階段:
媽媽配菜,媽媽根據家人一天要吃的菜肴規劃,挑選各種各樣的菜、肉組合在一起,有的直接可以食用,有的需要再加工,即烹調,然后端出來擺到餐桌上,家人只需要帶一張嘴即可享用,對BI項目來說,就是報表的制作過程,業務分析人員,根據領導的要求,按照各個主題需求,從各個數據立方體中、或者一部分從數據倉庫中取一些數據組合起來,并且定義展現方式,即把報表做好,發布出來,放到門戶上,給與權限控制,哪些人可以享用這桌美味,這就是報表制作這個階段干的事情,所以說,業務人員是否可以拖拽制作報表,關鍵看前面的數據立方體準備好沒有,相當于是這樣的,不是人人都是烹調高手,但是超市里面有很多配好的菜(蔥姜蒜都有了),你只要拿回去放放鍋里炒5分鐘或者蒸煮10分鐘,端出來即可,不難吧。至于加工的工具是微軟家的鍋還是IBM家的灶,或者oracle家的飄,有什么關系呢,這些都是報表制作工具(烹調工具而已)。
第六階段
享受美味佳肴,把做好的一桌筵席,放到門戶上,當然是給有權限的人享受,這就是管理駕駛艙噻。
通過上面的分析,懂的為什么會做飯的人就會做大數據分析了,簡單吧,所以過年回家和媽媽學做飯,學會了就懂得高大上的大數據分析。
附:美食制作過程和數據分析過程對比圖