機器學習的誘惑并不總是大的新功能,通常它最擅長的是微小的調整,微妙地改善用戶體驗。所以Twitter的使用神經網絡自動裁剪圖片預覽到他們最有趣的部分。
該公司一直在研究這個工具,但昨天在博客文章中詳細描述了它的方法。ML研究員盧卡斯Theis和ML領導Zehan王解釋他們如何開始使用面部識別來裁剪臉部圖像,但發現這種方法不適用于風景和其它物體照片。
他們的解決方案是“使用顯著性裁剪”,這里的顯著性意味著圖像中最有趣的一個方面,為了定義這一點,他們使用學術研究中的數據進行眼動追蹤,記錄人們首先看到的圖像區域。 這些數據可以用來訓練神經網絡和其他算法來預測人們可能想看的東西。
一旦他們訓練了一個神經網絡來識別這些區域,他們需要優化它在網站上實時工作。對他們來說幸運的是,照片預覽所需的裁剪非常廣泛,只需將圖像縮小到最有趣的三分之一,這意味著推特可以削減和簡化神經網絡判斷標準,即使用稱為“知識蒸餾”的技術。
最終的結果是得到速度比原先快10倍的神經網絡,這可以讓我們在所有圖像上傳并實時剪切的情況下對所有圖像進行顯著性檢測。這個新功能目前正在桌面,iOS和Android應用上向所有用戶推出。