研究人員最近發(fā)布了一個(gè)分步驟的指南,展示神經(jīng)網(wǎng)絡(luò)——實(shí)質(zhì)上是多層數(shù)學(xué)函數(shù),它們松散地模仿大腦中神經(jīng)元的行為,可用于生成任何藝術(shù)家風(fēng)格的原創(chuàng)歌詞,從表面上看是這樣。他們選擇的算法是長(zhǎng)短期記憶(LSTM)網(wǎng)絡(luò)。總體而言,訓(xùn)練數(shù)據(jù)集越大,結(jié)果越好。為了進(jìn)行演示,研究人員為該神經(jīng)網(wǎng)絡(luò)提供了10,000首歌曲的歌詞文本文件。
你不能將原始韻腳送入人工智能系統(tǒng),需要進(jìn)行一些預(yù)處理。正如這一教程的作者所解釋的那樣,歌詞數(shù)據(jù)用于構(gòu)建詞匯表映射,它通過單熱編碼進(jìn)一步轉(zhuǎn)換即分類變量(在本例中為單詞)轉(zhuǎn)換為整數(shù)數(shù)據(jù)的過程。
在Keras(一個(gè)用Python編寫的開源神經(jīng)網(wǎng)絡(luò)庫)和谷歌的TensorFlow機(jī)器學(xué)習(xí)框架中制作機(jī)器學(xué)習(xí)模型,并存儲(chǔ)權(quán)重和偏差值,隨著時(shí)間的推移調(diào)整網(wǎng)絡(luò)突觸連接的強(qiáng)度,研究人員為其提供歌詞并開始訓(xùn)練。一旦模型達(dá)到了預(yù)期的準(zhǔn)確度,它們就會(huì)產(chǎn)生新的歌詞。毫無疑問,人工智能在解析自然語言方面越來越好。但是現(xiàn)在還可以肯定的是,歌曲作者們暫時(shí)不會(huì)失業(yè)。