數據挖掘和機器學習的區別和聯系,周志華有一篇很好的論述《機器學習和數據挖掘》可以幫助大家理解。
數據挖掘受到很多學科領域的影響,其中數據庫、機器學習、統計學無疑影響最大。簡言之,對數據挖掘而言,數據庫提供數據管理技術,機器學習和統計學提供數據分析技術。
由于統計學往往醉心于理論的優美而忽視實際的效用,因此,統計學界提供的很多技術通常都要在機器學習界進一步研究,變成有效的機器學習算法之后才能再進入數據挖掘領域。從這個意義上說,統計學主要是通過機器學習來對數據挖掘發揮影響,而機器學習和數據庫則是數據挖掘的兩大支撐技術。
從數據分析的角度來看,絕大多數數據挖掘技術都來自機器學習領域,但機器學習研究往往并不把海量數據作為處理對象,因此,數據挖掘要對算法進行改造,使得算法性能和空間占用達到實用的地步。同時,數據挖掘還有自身獨特的內容,即關聯分析。
而模式識別和機器學習的關系是什么呢,傳統的模式識別的方法一般分為兩種:統計方法和句法方法。句法分析一般是不可學習的,而統計分析則是發展了不少機器學習的方法。也就是說,機器學習同樣是給模式識別提供了數據分析技術。
至于,數據挖掘和模式識別,那么從其概念上來區分吧,數據挖掘重在發現知識,模式識別重在認識事物。
機器學習的目的是建模隱藏的數據結構,然后做識別、預測、分類等。因此,機器學習是方法,模式識別是目的。
總結一下吧。只要跟決策有關系的都能叫 AI(人工智能),所以說 PR(模式識別)、DM(數據挖掘)、IR(信息檢索) 屬于 AI 的具 體應用應該沒有問題。 研究的東西則不太一樣, ML(機器學習) 強調自我完善的過程。 Anyway,這些學科都是相通的。