借助Google DeepMind分支創建的新的語音合成系統WaveNet,Google Assistant將聽起來更加自然。
WaveNet與傳統的連續式TTS(語音合成)不同,傳統的連續式TTS使用單個語音演員大量的預錄制語音,而參量式TTS使用計算機生成的語音,可以使用每秒16,000個樣本創建單個波形。
WaveNet使用了大量的語音樣本數據,已經訓練超過12個月來識別哪些音調相互依存,以及什么波形是真實的。
WaveNet將暫時使用在美國英語和日語中,但之后可能會運用到其它語言中,點擊此鏈接(需梯子)可以收聽使用WaveNet前后的谷歌Assistant聲音區別。