作為移動互聯網行業最為熱門的創業領域,在過去的幾年中,移動社交類App和UGC類App大量涌現,因此在盡力確保產品定位差異化的同時,打造健康的社交生態也成為這些App能得以獲得長期發展的關鍵。然而,由于這類App每天生成的圖片信息量通常很大,并且有大量的色情圖片混雜其中,所以高效準確地鑒別和剔除這些淫穢色情信息成為一項十分艱巨的任務。
傳統鑒黃方法及其局限性
常用的鑒黃方式有3種:公眾舉報、人工鑒黃和使用基于開源圖像識別算法的鑒黃工具。這些方法雖然能讓網絡環境的健康程度得到部分緩解,但仍存在一些局限性。
l公眾舉報。目前很多帶有社交屬性的網站和App,都會為用戶開通了舉報功能。用戶在瀏覽內容中發現黃色圖片等淫穢信息,都能通過點擊相應按鈕或者鏈接的形式,向網站管理員舉報,并由網站管理員完成刪圖或者封號等后續處理。但從目前實踐情況來看,這個方式收效甚微,用戶的參與度并不高,而且舉報數量較少。
l人工鑒黃。隨著鑒黃重要性的日益凸顯,很多企業都設有類似“鑒黃師”這樣的崗位,以最快的速度瀏覽、審核用戶上傳的圖片,并及時處理所發現的色情信息。但隨著色情信息量日益增多并且傳播方式愈發隱蔽,人工鑒黃的速度和質量都在逐漸降低,遺漏和判斷失誤在所難免。而且由于黃色圖片強大的視覺沖擊,鑒黃師們很難連續工作幾個小時,通常工作2到3個小時之后,就要換成其他工作內容或者短暫休息一下緩解一下狀態和心情。
l使用基于開源圖像識別算法的鑒黃工具。由于人工鑒黃存在諸多局限性,所以有越來越多的企業開始嘗試結合一些開源圖像識別算法來自己開發相應的鑒黃工具。但這其中存在著很高的技術門檻:首先圖像識別、機器學習、圖標分類標定等方面的算法非常復雜,要結合這些算法做研發和優化,需要很精專的技術人員,而絕大數企業都不具備這樣的人才資源;其次,即便這樣的鑒黃工具能夠開發成功,但識別過程中所需的樣本圖卻很難收集,需要很長時間的積累,并且積累過程中需要不停地修正圖像識別模型,以提高準確度。
七牛云國內首推圖片鑒黃服務
基于此,七牛云攜手專注于圖像識別技術的圖普科技推出了圖片鑒黃服務(nrop),幫助七牛用戶有效判斷保存在七牛云的圖片是屬于色情、性感還是正常,并給出判斷的分數,分數越高判斷為該類別的概率越大。該服務是通過基于深度學習的人工智能技術來實現圖像識別的,從而用計算機替代人工對黃色圖片的審核服務,有相關鑒定需求的企業直接接入該系統即可實現圖片的自動檢測。
據了解,七牛云是國內第一家提供此項服務的云服務提供商,意在通過高效準確的自動化鑒黃服務,降低企業使用鑒黃服務的技術門檻,從而很大程度上幫助企業減少相關人力成本的投入。
與以往的人工鑒黃方式相比,七牛本次推出的圖片鑒黃服務有以下幾個很明顯的優勢。
1.成本降低的同時,效率大大提高。鑒黃師平均每天審核處理的圖片數只能在1萬張左右,每臺機器一天可以審1000萬張圖片。
2.準確率提高,誤判少。 根據第三方服務提供商評測的結果顯示,七牛鑒黃服務的準確度超過99.5%,可以替代90%以上的人工審核,并且機器有強大的自學習能力,可以通過不斷學習提高鑒別的準確度。 此外,鑒黃服務每周會更新升級一次樣本庫,以便更好地鑒別越來越隱蔽的色情圖片。
3.全時工作。由于工作內容的特殊性,人工鑒黃很難長時間連續工作,而機器鑒黃可以做到7*24小時不眠不休。
而與前面講述的企業使用自研發的鑒黃工具相比,圖片樣本缺乏和準確度需要長期訓練才能達到可用標準等問題,在七牛云提供的鑒黃服務中完全不存在。因為在正式接入七牛平臺之前,圖普科技的鑒黃服務已成功接入迅雷、酷狗和比鄰網等多個平臺,樣本庫中的圖片樣本已積累過億,而且每周會對樣本庫做一次版本升級,將新識別出的樣本加入其中。此外,經過大量的實踐很好地訓練了圖像識別模型,這使得圖普科技的圖片鑒黃服務的準確度能達到上文中所提到的99.5%。接入七牛之后,鑒黃服務將以公有云服務的形式供七牛平臺上的所有用戶使用,這樣圖片樣本將在很短時間內大量積累,準確度也會同時得到更快的提升。
開放第三方數據處理服務,打造完整的數據生態
幾年來,七牛云一直在全力打造高效穩定的云服務平臺,并基于此提供了一站式數據管理服務,能有效地幫助開發者提高開發效率、優化產品體驗和降低業務風險,使用戶縮短了產品從想法到上線的距離。目前,七牛云平臺上已有數十萬企業和開發者用戶,日均上傳文件量為5億,獨立IP覆蓋國內50%以上的網民。所服務的企業中不乏一些重量級和明星企業,如新型創業中的美圖、Camera360、窮游、豌豆莢、陌陌、唱吧等,也有傳統企業中的順豐、PPTV、步步高、OPPO、海康威視、平安科技等。
在移動互聯的時代下,七牛認為從數據的產生、傳輸、托管,到數據處理以及分發,在數據全生命周期上的每一個節點,都可以通過云服務的技術和產品,加以支持。因此,七牛致力于成為為用戶提供完整解決方案的海量數據管理平臺,除了基礎的數據托管,加速以及基本處理,也逐步支持各類圍繞數據的第三方服務的接入,或用戶自定義的數據服務開發,以形成圍繞數據管理展開的生態體系。本次推出的圖片鑒黃服務是七牛云平臺上推出的首個第三方數據處理服務,后續會聯合更多的第三方開發者接入七牛云平臺,打造更為完整的數據管理生態。通過一段時間的內測,七牛小伙伴Same和小恩愛已在使用圖片鑒黃服務,節省了90%的人力成本。
目前,七牛圖片鑒黃服務已正式上線。即日起至2015年6月30日,用戶均可參與我們的“七牛用戶關愛計劃之--鑒黃服務免費用”活動,申請免費使用本服務,免費使用期為2015年6月至8月,每月免費額度上限為60萬次(即當月鑒黃服務賬單可免1500元),超出部分按85折計費。免費使用期結束后,用戶還可以享受三個月(9月~11月)的鑒黃服務85折優惠。查看“閱讀原文”了解活動詳情。
并且為了進一步地豐富和完善數據管理生態體系,七牛將于6月15日推出小廣告過濾功能,為七牛小伙伴們提供更多貼心選擇,還廣大網友一片清新寧靜。