近年來,隨著智能家居、車聯網等領域的快速發展,物聯網已經從各個方面越來越多地滲透到人們的生活當中。簡單地說,物聯網就是利用局部網絡或互聯網等通信技術把傳感器、控制器、機器、人員和物等通過新的方式聯在一起,形成人與物、物與物相聯,實現信息化、遠程管理控制和智能化的網絡。
萬物相連的物聯網,將會產生非常有價值的大數據。這些數據可以幫助城市預測事故與犯罪;讓醫生實時查看病患的心臟起搏器和生物芯片中的信息;通過預測性維護設備和機械,可以讓工業產量最佳化;通過與家用電器的連接,向用戶提供與自己的車輛和手持設備的危機通信從而建造真正智能的房屋。這些可能性都是由物聯網所帶來的,而且它所帶來的便利還會越來越多。
由于連接物聯網的設備與傳感器還會繼續快速擴張,而由這些設備產生的數據總量將會增長到一個難以置信的等級。這些數據擁有著極大的價值,可以讓我們洞察出哪些是有用的,哪些是沒用的。
這聽起來很不錯。然而,最大的問題將是尋找一種方式來分析由這些設備產生的數量極多的數據和信息。如果你曾經嘗試過在幾TB的數據中找出你所需要的文件的話,那么你就會知道這一做法是有多困難了。對人類而言,要審查并了解所有這些數據根本不可能做到,如果用傳統方法這么做的話,即使減少樣本大小,仍然需要花費很多時間。
我們需要提高大數據分析的速度和準確度,從而讓物聯網實現它所承諾事情。如果我們不這樣做,那么后果將會是災難性的,波及范圍將從小到家用電器之間不能互相通信,大到危及生命—心臟起搏器失靈或上百輛車連環相撞。
唯一一種可以跟上物聯網產生數據的速度,并可以挖掘數據中擁有的隱藏信息的方法就是利用機器學習能力。
機器學習已有應用
維基百科將機器學習定義為“計算機科學(CS)和人工智能(AI)的子域,隨著系統的建設和研究,可以從數據中自行學習,而不是只遵循明確的程序指令。”
雖然這聽起來有點像科幻小說,但是它已經存在于日常生活中。例如,Pandora這個流媒體音樂播放器就在使用這個技術,以確定用戶還會喜歡哪些其他的歌曲;Amazon.com也會為用戶提供其他書籍和電影的推薦。以上兩者都是通過對用戶行為的監測,系統自動學習并作出判斷。
在有物聯網的情況下,機器學習可以幫助企業將他們擁有的數十億個數據點歸結為真正有意義的信息。機器學習總的前提是一樣的,審查和分析你所收集的數據并從數據中學習“信息”,讓我們可以更好的做一些決定。
例如,追蹤你健康的穿戴式設備已經成為了一個新興的產業,但很快這些設備將發展成為既可以相互連接,也可以連接到互聯網的產品,跟蹤你的健康并提供實時更新的健康服務。
物聯網要做到的是,當你的身體健康出現狀況時,你的醫生會收到通知,例如你的心率提高到了一個不安全水平,甚至是發生了停止。為了能夠發現潛在的問題,數據分析就需要知道什么是正常的,什么不是。相似性、相關性和異常需要基于實時的數據流被快速識別出來。
為了立即進行數據分析,它在收集數據時就能準確地識別先前已知的信息和以前從未見過的新信息。機器有產生和聚集這些大數據的能力,這些大數據也必須被用于學習每個患者正常行為并追蹤、發現和標記在正常行為以外的所有事情,因為這些可能表明了患者存在嚴重的健康問題。
物聯網的實現依賴于能夠獲得隱藏在現有龐大的數據和不斷增長的數據中的信息,再對信息作出深度挖掘。未來物聯網的實現依賴于機器學習,將會改善我們日常生活中的每一個方面。