在美國,想要成為總統(tǒng)的首要條件就是要有一個好口才,在不斷的演講和辯論中立于不敗之地才能獲得最終的成功。而谷歌就過分了,他們培養(yǎng)的人工智能在圍棋圈稱霸之后,居然推出了Tacotron2來訓練人工智能技術(shù)學習演講,難道要培養(yǎng)AI當總統(tǒng)嗎?
谷歌在人工智能語音技術(shù)方面的研究一直處于世界頂級水準,而新發(fā)布的Tacotron 2集成了谷歌語音生成兩大技術(shù)WaveNet和Tacotron1,通過神經(jīng)網(wǎng)絡(luò)訓練的方式,發(fā)揮出當前技術(shù)性的極限,在幾乎沒有任何語法專業(yè)性問題的情況下將文本轉(zhuǎn)變?yōu)檠葜v。
谷歌之前推出的兩大技術(shù)雖然優(yōu)秀但各有瑕疵,難以最終生成演講的音頻,而Tacotron 2使用文本和文字敘述來計算各種語言規(guī)則,不需要人工確認系統(tǒng)規(guī)則。同時在文本處理之后,對于節(jié)奏和強調(diào)性提升, 演講的節(jié)奏感較好。不過問題在于一些不夠直觀的單詞發(fā)音依然會存在問題,甚至在極端情況下可能出現(xiàn)噪聲,而且目前對于演講的語調(diào)情緒控制依然存在不足,如樂觀或擔憂等情緒比較難以控制。
谷歌在人工智能的訓練方面已經(jīng)越走越遠,繼AlphaGo的成功之后,谷歌還會創(chuàng)造出怎樣神奇的AI產(chǎn)品呢?也許Tacotron2成熟的時候真能競選上總統(tǒng)呢。