精品国产一级在线观看,国产成人综合久久精品亚洲,免费一级欧美大片在线观看

Google發布語音指令數據集

責任編輯:editor004

作者:Beining

2017-08-29 11:35:21

摘自:INFOQ

Google認識到,互聯網上沒有可供入門者快速入門深度學習的語言數據集,所以他們開源了語音指令數據集。TensorFlow和AIY團隊開源的數據集包含65000個錄音,每個錄音時長幾秒鐘,包含30個左右的單詞。

深度學習在語音識別方面的使用方興未艾,但是可用的訓練數據集卻不多見。雖然Kaldi這種軟件可以使用神經網絡進行訓練,但是復雜的操作嚇退了很多小白。Google認識到,互聯網上沒有可供入門者快速入門深度學習的語言數據集,所以他們開源了語音指令數據集。

TensorFlow和AIY團隊開源的數據集包含65000個錄音,每個錄音時長幾秒鐘,包含30個左右的單詞。它們是通過網站采集而來的,參與人數達到了數千人。團隊貼心地附上了訓練和預測的TensorFlow示例代碼。數據集基于署名4.0 國際(CC By 4.0)許可發布,Google表示將繼續擴充這個數據集。Google還指出,這個數據集特別適合新手入門。此外,他們也開源了收集錄音的工具。

對于想嘗鮮的人,Google制作了一個基于TensorFlow的Android程序。程序會詢問獲取麥克風權限,隨后會給出10個單詞,程序將高亮顯示已經被你讀過的單詞。

這個例子的效果和數據集有很大的關系,有可能不盡如人意,畢竟商業語言識別系統比這個復雜的多。Google希望隨著更多的數據加入,模型的識別效果會日趨完善。

使用TensorFlow進行語言識別的教程可以在這里找到。使用最新版本的TensorFlow和主流配置,模型訓練只需要幾個小時。對神經網絡進行微調可以解決不同的問題,例如不同的響應時間、大小,以及在不同平臺上的準確度取舍問題。

查看英文原文:Launching the Speech Commands Dataset

鏈接已復制,快去分享吧

企業網版權所有?2010-2024 京ICP備09108050號-6京公網安備 11010502049343號

  • <menuitem id="jw4sk"></menuitem>

  • 主站蜘蛛池模板: 明光市| 油尖旺区| 宝清县| 新兴县| 武川县| 连江县| 安义县| 雅江县| 德钦县| 灵山县| 赤壁市| 昌图县| 迁西县| 郁南县| 崇文区| 商城县| 德清县| 林周县| 静乐县| 新泰市| 日喀则市| 肇东市| 自贡市| 阿勒泰市| 文成县| 确山县| 扶沟县| 柘荣县| 宝应县| 平定县| 革吉县| 江安县| 南阳市| 建德市| 榆林市| 南平市| 潮安县| 垣曲县| 平乡县| 务川| 宽甸|