Makoto Koike對TensorFlow如何學會了他這個黃瓜種植戶的黃瓜選擇和分類原則進行了。這個話題在Hacker News上被斥為谷歌的市場營銷,而在其他地方則被當成是深度學習、神經網絡和機器學習日益流行的案例。TensorFlow的學習結果大大超出了預期。選擇和分類通常是一個非常耗時的過程,在收獲的高峰季節(jié),臨時員工都無法在短期內學會,這經常導致Koike一家根據(jù)若干屬性花費大量的時間對黃瓜進行仔細的整理和分類。
Koike使用了由其家庭成員耗時三個月分類完成的7000張黃瓜圖片作為訓練數(shù)據(jù)集。在對該神經網絡進行測試時,他通過Raspberry Pi控制圖像數(shù)據(jù)的獲取,供經過訓練的神經網絡處理。在實驗組(其中的圖像數(shù)據(jù)不包含在訓練集中)上,該網絡的成功率達到了70%到90%。CUCUMBER-9庫提供了訓練數(shù)據(jù)集。據(jù)報道,TensorFlow python api的代碼實現(xiàn)是由TensorFlow Deep MNIST for Experts提供的示例代碼修改而來。這篇文章沒有具體說明Koike訓練模型時使用的計算概要文件,也沒有實際演示經過訓練的網絡。對于該模型的效率和準確率,Koike表示:
在我對測試圖片進行驗證時,識別準確率超過了95%。但如果把這個系統(tǒng)應用在真實的場景中,準確率降低到大約70%。我懷疑神經網絡模型因為訓練圖片數(shù)量不足產生了“過擬合”問題(這是神經網絡中的一個現(xiàn)象,經過訓練的模型只適合小規(guī)模的訓練集)。
分類問題符合良好深度學習對象的一般模式;圖像屬于“我看到它就知道它”的類別,或者是直覺和經驗驅動的分類,那通常很難使用語言簡單地描述出來,需要豐富的經驗才能做好。Koike詳細闡述了這個話題,他指出:
分類工作不是一項容易學習的任務。你不只要考慮大小和粗細,還要考慮顏色、紋理、小劃痕,是直是彎,是否多刺。這需要花費幾個月的時間來學習,你不能只在最忙的時候雇用兼職人員。我自己都是最近才學會如何把黃瓜整理好。
對于當前的原型,擴展性和計算時間是Koike面臨的一項挑戰(zhàn),即使將圖片轉換成低分辨率(80x80)的圖片,該訓練模型仍然需要兩到三天的時間處理那個包含7000張圖片的訓練數(shù)據(jù)集。雖然Koike表示感興趣,但他還沒有在Google Cloud ML上執(zhí)行訓練。那是谷歌推出的一個用于分布式TensorFlow訓練的大規(guī)模集群。他還指出,他尚未對不同參數(shù)、配置和算法的組合進行測試。
查看英文原文:TensorFlow Learns Cucumber Selection and Classification