隨著機器學習應用的增多,很多人需要了解采用機器學習訓練數據的好處。
如果用戶使用基于機器學習的系統,那么需要了解有關訓練數據的知識。在將數據加載到人工智能模型以進行模型訓練之前,必須正確格式化數據并確保其準確性。
假設用戶正在使用公共云中流行的機器學習系統創建欺詐檢測引擎。首先需要創建用于訓練模型的數據集:而在這個案例中將處理數百萬個帶有欺詐交易標記的交易記錄。這樣,通過模型就可以了解哪些可能是欺詐的,哪些不是。當然,訓練數據有不同類型,有些帶有標記,有些沒有。
經過訓練之后,這種模型實際上可以通過了解可能的欺詐行為而不是通過經驗學習來繼續訓練。如果用戶有時間的話,這個模型可以通過監控那些被工作人員或其他系統標記為欺詐的交易來訓練自己。
這種人工智能訓練方法令人印象深刻的是,用戶需要一個完善的訓練數據集。在某些情況下,可以從公開或專有的訓練數據代理那里獲取。在大多數情況下,用戶可以格式化自己的數據來訓練機器學習模型。但是,是否有可以隨時隨地進行訓練的機器學習模型?
這個想法并不新鮮。自從人工智能出現以來,人們一直想讓人工智能引擎教會另一個人工智能引擎,也就是共享訓練數據。或者更好的辦法是,通過自動的直接交互來共享知識和經驗。或者通過人工智能引擎指導者提供外部經驗,從而使人工智能模型更有價值和更有效。
這說起來容易做起來難。機器學習引擎即使采用相同的軟件,也通常不會互相對話。對于獨立的學習者需要從頭開始設計,并與非人工智能系統或人類進行交互。但是,大多數供應商都在進行人工智能引擎之間的訓練。
最近人們將看到一些可能改變游戲規則的主要趨勢:
•首先,是使用按需或基于SaaS的人工智能引擎,該引擎可以與公共云或內部部署的其他人工智能引擎進行交互。可以將它們視為SaaS,這個云平臺專門針對其他人工智能引擎講授特定技能集,從發現欺詐性交易、醫療診斷到機器維護等等。
•其次,人工智能引擎能夠與其教學模型相結合,創造出各種人工智能的超級大腦,不僅能在其領域之外提供經驗,還能與自己的訓練數據相結合,提供本地和全球的體驗。
之所以提出這一點,是因為大多數企業要想從人工智能中獲得更多價值,就需要了解這些趨勢,其中包括機器學習和深度學習。而且,許多企業正陷入沒有足夠的訓練數據來使機器學習正常運行的困境。這可能是解決這兩個問題的很好的辦法。
版權聲明:本文為企業網D1Net編譯,轉載需注明出處為:企業網D1Net,如果不注明出處,企業網D1Net將保留追究其法律責任的權利。