在云計算時代,一種較好的解決方案是將數據導出到開發模型的云中,并在模型能夠投入使用后將模型導回到設備上。這非常具有吸引力,特別是因為預計到2021年所有生成的數據中有94%將在云中處理,這意味著可以利用其他數據源,無論是歷史數據還是源于其他物聯網設備的數據。然而,將復雜模型存儲回內存受限的設備本身可能是一個挑戰,因為具有大量參數的復雜模型(如深度學習模型)本身通常非常大。另一方面,包括從設備向云上的模型發送數據以進行推理步驟的解決方案也可能不是最優方案,尤其是在需要延遲非常低的情況下進行。另一個挑戰是物聯網設備可能無法連續連接到云,因此可能需要一些本地參考數據用于脫機處理,并具有獨立運行的功能。
這是邊緣計算架構變得有趣的地方,因為它使數據能夠在邊緣設備級別進行初始處理。在安全性方面,這種方法特別有吸引力;而且這種方法非常有利,因為這樣的邊緣設備能夠過濾數據,減少噪聲并且當場改善數據質量。
不出所料,人工智能工程師一直試圖獲得兩全其美的方案,并最終開發了霧計算,這是一個去中心化的計算基礎設施。在這種方法中,數據,計算能力,存儲和應用程序以最合理的方式在設備和云之間分布,最終將它們更緊密地結合在一起來發揮它們各自的優勢。轉移學習事實證明,物聯網設備能夠生成大數據,但,使用外部歷史數據集開發物聯網智能應用程序并不罕見。
這意味著可以依靠多個物聯網設備(通常是多個用戶的相同類型的設備)或完全不同的數據源生成的數據。
應用程序越具體和獨特,現有數據集可供使用的可能性就越小,例如,當設備捕獲Imagenet中特定類型的圖像而與開放源圖像數據集沒有相似性時。但物聯網應用程序實際上是幾種現有的現成模型的巧妙結合,這使得轉換學習很好地適應了物聯網背景下智能應用的發展。轉移學習范式包括在數據集上訓練模型(通常是黃金標準),并用它來推斷另一個數據集。或者,可以將在生成此模型期間計算的參數用作在實際數據集上訓練模型時的起點,而不是將模型初始化為隨機值。在這種情況下,我們將原始模型稱為“預先訓練好的”模型,我們對應用程序特定的數據進行微調。這種方法可以將訓練階段加速幾個數量級。
使用相同的范例,可以訓練一個通用模型,最終用戶可以直接使用這些數據。安全和隱私問題由于互聯網連接設備技術通過提供物理和網絡世界之間的連接來擴展當前的互聯網,因此它生成的數據是通用的,但也是導致嚴重隱私問題的原因。
事實上,參與物聯網的大約50%的組織認為安全性是物聯網部署的最大障礙。考慮到大約三分之二的物聯網設備處于消費領域,以及一些共享數據的私密性,也就不難理解安全性問題為什么會是一個難題了。 這些顧慮以及與云頻繁數據傳輸相關的預期風險,解釋了用戶為何提出保護其數據的要求。然而,當這些物聯網應用程序由“聯合”數據(即由多個用戶生成的數據)驅動時,事情會變得更加隱伏:不僅可能直接泄露用戶數據,當惡意代理對機器學習算法的輸出進行逆向工程以推斷私人信息時,就可能間接暴露用戶數據。
因此,很有必要在發展物聯網的同時建立起完整的數據保護法。物聯網機器學習是以人為中心的機器學習由于物聯網設備使互聯網更貼近用戶并觸及人類生活的各個方面,因此它們通常允許收集相關數據。物聯網數據描述了用戶生活的方方面面,并使其比以往更容易理解用戶的需求,愿望,歷史和偏好。這使得物聯網數據成為完善的數據,可以根據用戶的個性創建個性化的應用程序。而且由于物聯網通過收集高度個性化的數據以及提供高度個性化的應用和服務來親密接觸我們的生活,因此物聯網機器學習有真正成為以人為本的機器學習的資格。