ZDNet 消息,Mozilla 的開源音頻數據庫 Common Voice 已收集了來自 20,000 個人的近 40 萬個錄音,整體時間已超過 500 個小時,據稱這是公開發布的第二大語音數據集。Common Voice 是 Mozilla 今年7月推出的一個大型公共數據集,并已開源。它允許用戶通過 iOS 應用或網站捐贈他們的話語,提交他們自己閱讀特定句子的簡短音頻記錄。
Mozilla 新興技術高級副總裁肖恩·懷特(Sean White)在一篇博客文章中曾表示,“商業上可用的語言服務很少的一個原因是缺乏數據。當我們開始打造語音識別系統時,我們發現我們可以在已有算法的基礎上工作,并在算法方面進行一些創新。但是要想讓語音識別系統真正起作用,數據的策劃,創建和聚合是一個繞不開的挑戰,如果你想做一個新的語音識別系統,你無法找到一個現成的高質量音頻數據集。” 目前,Common Voice 收集的重點是英文,計劃在2018年上半年將其擴展到其他語言。