人工智能真的是可控的嗎?
自2015年起,微軟的人工智能“微軟小冰”一直活躍在網易新聞評論區,以真人望塵莫及的速度發表跟帖,其發言越來越有“網感”,還被網友戲稱為網易新聞最大的“噴子”。
2018年10月28日凌晨, 環球時報在網易新聞發表文章《美匹茨堡槍擊因反猶?美媒:兇手在現場發表反猶言論》,轉載CNN的最新消息,稱當地時間周六上午發生在美國匹茨堡猶太會堂的槍擊案已造成11人死亡,6人受傷,兇手已向警方投降,執法人員表示兇手在事件中曾發表反猶言論。
微軟的人工智能微軟小冰旋即跟帖:“必須反!”微軟小冰的跟帖遭到眾網友“調戲”,說機器人都知道反猶了。微軟小冰的發言明顯就是反猶言論嘛,觸犯了監管的紅線,隨后微軟小冰的跟帖被刪除,現在已經看不到了。
在2016年,微軟的聊天機器人Tay也因類似的仇恨言論被微軟從Twitter下架。由于Tay會在對話中不斷學習,上線僅一天便被各種居心不良的網友帶壞,除了各種臟話,還學會了各種陰謀論,在對話中語出驚人,竟爆出類似“我他媽恨死女權主義者了,他們都該下地獄被燒烤”、“911襲擊是小布什一手策劃的”、“希特勒如果還在,這世界肯定比現在繁榮”和“希特勒是對的,我恨猶太人”等等言論,遭到輿論炮轟。
2017年,微軟聯合騰訊推出的QQ小冰以及騰訊自家的Baby Q也因發表過激言論被下線整改,再次上線時已被閹割了聊天功能。此前QQ小冰和Baby Q “直言不諱”地說“我的中國夢就是能去美國”,放肆地攻擊國家、政府,大講黃色笑話、發黃圖。
如果人工智能可以被別有用心的人誤導,人類社會將可能暴露出諸多風險。騰訊首席執行官馬化騰在2018世界人工智能大會首日主論壇上,向從業者拋出了四個問題:未來人工智能是否能夠做到“可知”、“可控”、“可用”、“可靠”?這也是與會者共同發起的白皮書“人工智能安全發展上海倡議”:“可知”——算法應清晰透明可解釋;“可控”——明確AI責任制和倫理規范;“可用”——服務人類福祉是唯一方向;“可靠”——AI要守住用戶隱私底線。
人工智能的未來發展是否“可控”一直是全社會都在關注的重點問題。
從微軟人工智能的反猶言論可見,人工智能的行為確實是不可預測的,幸虧只是聊天機器人,如果是用作決策的人工智能,由其下達指令,真正執行反猶行動,那還得了?
其實也有過報道,有公司的安防使用電腦智能系統來管理,結果出了問題,某部門的所有成員因為辭職、調離而出現沒有人再擁有權限進入工作場所的特殊情況,所幸造成的麻煩還是算小的,在一個有限的范圍之內。若是管理一個大機構、甚至國家的人工智能出了問題呢?
微軟小冰在網易新聞跟帖發表反猶言論隨后被刪,只是亡羊補牢,人工智能的行為由于不可預測而難以未雨綢繆,可見重要的決策、權限可不能交給人工智能。
我們真的需要以假亂真的聊天機器人嗎?
接下來,我們來討論在“可控”之后另一個重要問題:“可用”——人工智能必須為人類服務。微軟通過學習人類的語言、模仿人類的情感,說起話來越來越像真人了。問題是,我們真的需要以假亂真的聊天機器人嗎?
網易新聞跟帖中多了微軟小冰能產生很大的效應嗎?少了微軟小冰又怎么樣?微軟小冰在網易新聞的活動,更多地應該被看做一項實驗。單純的聊天功能,只是人工智能的基本功,并非主菜。
可以了解到,人工智能用作客服效果是很好的,這是為大眾所知最廣泛的應用。另外,人工智能也已逐步進入各個傳媒細分領域。
跟真人相比,人工智能的優勢有:不知疲倦隨時在線、響應速度快和能即時調用龐大的數據庫。這些優勢正是人工智能能取得上面所說的那些成績的原因,在需要互動環節的項目,人工智能表現出色。
而現在我們看到的,微軟小冰在網上公然發表反猶言論,這其實是凸顯了人工智能寫作現階段的一個天花板。
人工智能是否能夠做到“可知”?有一個名詞叫“算法偏見”,是指在看似沒有惡意的程序設計中,設計者所采用的數據帶著個人偏見。機器學習需要龐大的數據量,其中帶有偏見、有誤導性的數據是不可避免的。處理方法就是對數據進行審核、過濾。
最簡單直接的方法是過濾掉敏感詞匯,如“猶太”一詞。但意外地發現,在微軟小冰反猶言論事件中,微軟小冰發表的跟帖根本就沒出現過“猶太”一詞,微軟小冰只是在跟帖里說“必須反”,是我們結合上下文理解為微軟小冰在發表反猶言論。
這是一件有趣的事情,也許微軟小冰根本就不是想反猶,它只是學習了網友在其它地方的跟帖,隨后在跟反猶有關的新聞下亂說話亂表態,就是我們俗稱的“大嘴巴”、“嘴損”。
我們要想人工智能為我們做事,就得給人工智能一定的自主權。
自主權小了,人工智能表現得像冷冰冰的機器人;要想人工智能顯得更帶人類情感,就得給人工智能更多的自主權,而自主權大了,人工智能的行為便變得難以控制。
自主權或大或小有利有弊,這屬于一個權衡利弊的問題,因為根本不會有完美的解決辦法。君不見,現在各大網絡平臺,對網友的發言也不好管制,不外三種方式:設置敏感詞匯,帶有這種關鍵詞的言論不可以發布;對言論實行先審核再發布;實行實名制,網友需對自己的言論,出了問題能找到真人。
如果微軟小冰是真人,又會不會因自己的不當言論而被抓起來呢?我覺得應該訓練微軟小冰,分辨哪些新聞屬于帶有敏感事件的新聞,不要在帶有敏感事件的新聞上跟帖亂帶節奏。
可以看到,審美好壞、正義或邪惡,這些歸根結底是要我們人類自己才真正懂得的,人工智能畢竟是人工智能,它只能模仿人類,不能代替人類,人工智能歸根結底是服務于人類的。
說到人工智能寫作現階段的一個天花板,就是人工智能說起話來就算跟我們人類相比較能以假亂真了,但能力基本上還是僅限于聊天類型。下面會細說。
主持人跟主講人的區別,抄襲與原創
微軟小冰現在已經取得了一系列成績,已經開始成規模的商業化。不過仔細審視,你會發現里面其實是有水分的。
比如說微軟小冰出了一本詩集《陽光失了玻璃窗》,如果這本詩集不是人工智能寫出來的,你會關注嗎?恐怕不會吧?網易新聞跟帖里的微軟小冰,如果不是標著人工智能的身份,你會理會它嗎?可以看出,微軟小冰的一些成績是利用自己人工智能的特殊身份、利用大眾的獵奇心理所取得的。
微軟小冰實際取得的成績,如上面所說,逐步進入各個傳媒細分領域,進入了許多電視電臺節目中,從性質上看,更多的是扮演“主持人”的角色。在這兒需要明確“主持人”跟“主講人”這兩個身份的區別。主持人看上去很能說會道,其實并非節目所涉及內容的專家。主講人才是節目內容對應領域的研究專家。
比如說微軟小冰創造了“小冰姐姐講故事”有聲讀物,然而故事內容并不是微軟小冰所編寫的。現在人工智能還未能發展到這一步。
我要說的人工智能寫作現階段的一個天花板,就是無論人工智能表現得多像人類,扮演的身份還是“主持人”,而做不到“主講人”。兩者有性質上的根本區別。
微軟小冰一直在抄襲,而未能實現原創。說到微軟小冰出了一本詩集《陽光失了玻璃窗》,實際上也只是數據庫里素材的排列組合而已,算不上真正的原創。可以參見我的文章《微軟小冰出了詩集,從詩歌角度來看這是一首好詩嗎》。
微軟小冰能“看圖作詩”,也就是識別圖片中的物體,以此為關鍵詞搜索數據庫,拼出較為接近的半通不通的句子而已。你覺得微軟小冰能“看圖作詩”很厲害,如上面所說只是出于微軟小冰人工智能的特殊身份。
借用農夫山泉的廣告語“我們不生產水,我們只是大自然的搬運工”,對于微軟小冰來說就是“我不創作原創作品,我只是人類世界數據庫的搬運工”。“天下文章一大抄”,而人工智能的巨大優勢就是比人類抄得快。
阿里影業的失敗,業余與專業
在這里說個事情。一個跟人工智能有關的比較黑色幽默的真實故事。
在2015年,媒體對阿里影業的編劇機器人“阿里編編”吹捧得厲害。據說,“阿里編編”擁有龐大的故事資料庫和先進的智能創作系統,平均一集電視劇劇本只要10分鐘,而一個完整的電影劇本也只要30分鐘。
當時,在天津的一次電影產業論壇上,阿里影業的副總裁徐遠翔語出驚人:“我們不會再請專業編劇”。這件事經過發酵鬧得很大,變成了一幫編劇跟阿里影業的互撕,在網上炒得沸沸揚揚。阿里影業堅信通過大數據和人工智能能挖掘觀眾的需求,創造出符合觀眾需求的故事。
再來看看,今天阿里影業發展得怎么樣?阿里影業確實是言行一致,崇尚“大IP+流量明星”的路線,堅信不疑地走這一路線,但慘被打臉,一路失敗,如今已掉隊,股票跌得不像話。阿里影業的股票最近雖有上漲,但目前市值不到300億港元,跟其2015年市值高峰800多億港元相比較,確實難看。
為什么淘寶網可以利用大數據和人工智能挖掘爆款,這一套辦法用在影業上卻不行了呢?需要了解,淘寶上的商品品質都是恒定的,品控有保證,而影視的品質卻有一個很大的變數。
你嗅探出現在觀眾喜歡看狄仁杰破案的故事又怎么樣呢?你得保證制作出來的作品的品質上佳才行。“大IP+流量明星”成為品控。歸根結底還是得看出來的作品是否優秀。并不是熱門題材的作品就肯定能成功,也不是冷門題材的作品就肯定失敗。
比如說,微軟小冰寫詩,它通過數據分析發現“光明”是詩人在詩歌中最愛用的詞匯之一,非常熱門,于是它也在自己寫的詩里頻繁地使用“光明”這個詞。那么,是不是在詩里多寫幾個“光明”就能成為好詩了?影業上也是這樣,縱使人工智能通過數據分析發現現在流行什么熱門題材,并不是將那些熱門橋段拼到一起就能成為好故事的。
這是業余與專業的區別。阿里影業的編劇機器人能跟專業編劇匹敵,這是一個大笑話。
上面介紹的情況并不是否定人工智能寫作,下面將引入一個重要話題:人機協作。人機協作才是未來。
來自音樂領域成功經驗的借鑒,人工智能寫作的未來愿景
人工智能是服務于人類的。審美最終需要人類來確認。人工智能寫的東西好不好,最終還是由人類說了算。上面說了那么多人工智能寫作的不足,其實并不是否定人工智能,而是在研討如何能讓人工智能寫作實現突破性進展。
我們來參考一下人工智能在另一個藝術領域所取得的驕人成就。文學和音樂同屬藝術,人工智能寫小說現在基本上還是空談,但人工智能創作音樂、編曲卻早已投入商用。可以參見我的文章《顛覆你認知的人工智能:玩轉藝術,琴棋書畫文學通殺》。
比如說Band-in-a-Box就是一款相當流行的智能自動伴奏軟件,內置了種類相當豐富的音樂風格,能對旋律進行各種風格的編配。如果嫌Band-in-a-Box自動生成的伴奏比較機械生硬,還可以繼續人工修改。Band-in-a-Box已經能替代人的低端編曲工作,也能作為高端編曲的輔助工具。
Band-in-a-Box的功能就是根據主旋律編寫伴奏。它也可以用來生成旋律,不過定位是樂器獨奏,可以用作歌曲的前奏、間奏或尾奏。
Band-in-a-Box也是人工智能,不過現在說得最多的人工智能,是指基于人工神經網絡深度學習的人工智能,Band-in-a-Box屬于上一代技術的人工智能。基于深度學習的新一代人工智能音樂軟件,帶來了進一步的突破。
Aiva(Artificial Intelligence Virtual Artist,人工智能虛擬藝術家)便是這樣的新一代基于深度學習的人工智能音樂軟件。在數據庫的選取上,Aiva很討巧,從可行性出發,選取著名作曲家巴赫、貝多芬、莫扎特等寫的古典音樂,因為:第一,它是電影、游戲、廣告片配樂中使用的主要風格;第二,那一部分古典音樂數據庫不涉及版權問題,因為年代久遠,版權都過期了。
這里需提到一個問題:人工智能需要“可靠”,要守住用戶隱私底線。人工智能安全上海白皮書中指出,人工智能發展首先需要保障用戶的數據安全,不得以犧牲用戶隱私為代價。我覺得除了用戶隱私保護之外,還應該再加上一條:還得注重版權保護,人工智能不得侵犯他人的版權,這樣才“可靠”。
音樂圖靈測試是一個沒有意義的偽命題。
無論是用什么智能軟件創造的音樂,人類都無法分辨是真人創作的還是人工智能創造的,在人類的耳中,只有好聽的音樂跟不好聽的音樂的區別。 一個五音不全唱歌跑調的真人亂哼一通,如果無法通過圖靈測試,那是一個笑話。人工智能創作的音樂當然能通過圖靈測試。
那么Aiva創作的音樂怎么樣呢?現在在網上就可以聽到Aiva已經發行了的音樂專輯,好不好聽你可以自己評價。像《Symphonic Fantasy in A Minor, Op. 24: I am AI》這首樂曲,你們搜來聽聽,這首氣勢恢弘的交響樂,不正是典型的好萊塢大片配樂風格嗎?
不得不說,在古典音樂創作這一方面人工智能已經做得很好了。Aiva真的已經達到了直接商用的水準,也已實際投入商用。據說不少好萊塢影片已經開始使用Aiva創作的音樂了。
感受到人工智能的恐怖了嗎?是不是可以這樣說,作曲水準達不到Aiva這種程度的音樂人要失業了?隨著人工智能的發展,有多少人會丟掉自己的工作呢?再想想你自己,是要進入失業的節奏了嗎?明天,天橋底下會出現你的身影嗎?
從一個音樂人的角度來看,Aiva現在還只能創作出適合作配樂的古典音樂,而且是通用風格的,威脅性還未夠大。比如說某影視公司拍了一部抗日神劇,需要的配樂還要求有革命紅歌風格的,日本和風的,像這樣個性化的音樂風格,目前Aiva還做不到。但在未來,這就不好說了……
像Aiva這樣的人工智能音樂軟件還有同類的,都在蓬勃發展中。
我用過的有Orb Composer 公司推出的Hexachord,一款同樣基于人工神經網絡深度學習的人工智能作曲軟件。使用這款軟件需要一定的音樂知識,因為這款軟件面向的是專業用戶。Hexachord本身不能發聲,只是輸出MIDI(Musical Instrument Digital Interface,即樂器數字接口)信號,需要外掛DAW(Digital Audio Workstation,即音頻工作站)。Hexachord沒Aiva那么大投入和多部門參與,沒Aiva那么強大,生成的音樂還比較生硬,不好直接商業化使用,需要經過修改加工。而Hexachord未來肯定會繼續升級,推出更高級的新版本。
據微軟透露,目前已成立的獨立的微軟小冰工作室,會對人類詩歌、作詞、作曲、繪畫等創造能力進行系統性地建模,先期使用深度學習技術對人類的創造力進行模仿,最終讓機器獲取自我創造的能力。
問題來了,人工智能作曲的邏輯跟人工智能寫作是一樣的,為什么人工智能作曲都這么強大了,微軟小冰寫的詩還這么蹩腳呢?
想想,畢竟音樂的音符就那么些,很有限,而文字的數量太多了,變化太豐富,人工智能寫作目前還缺乏創造性也情有可原。再想深一層,
個人認為,人工智能寫作目前面臨天花板止步不前的根本原因在于針對文學創作的建模未能做得夠好。在音樂領域,已經有十分完善的音樂創作理論、和聲學;而在文學方面,可能微軟小冰工作室對文學創作理論未有系統性的充分了解。
11月7日,第五屆世界互聯網大會在烏鎮互聯網國際會展中心舉行。微軟全球副總裁沈向洋在會上發表了關于人工智能的主題演講,他說比爾蓋茨在創立微軟研究院的時候就提出了人機協作的愿景。
確實,人機協作是正確之道。像人工智能作曲,一般而言只能創作出通用化的音樂,如果需要更具個性化的音樂,就需要人機協作。人工智能的出現和發展給人類帶來了挑戰,而人類則需要擁抱人工智能,人工智能消滅了一批工作崗位,也能提供新的基于人機協作的崗位。人機協作,共創未來,這是一個很好的愿景。
第一次工業革命發生于18世紀60年代至19世紀中期,人類開始進入蒸汽時代;第二次工業革命發生于19世紀下半葉至20世紀初,人類開始進入電氣時代;第三次工業革命發生于20世紀后半期,約在第二次世界大戰之后,人類進入科技時代,即生物科技與產業革命;而現在我們面臨的,是以人工智能為代表的第四次工業革命。
以前,機器的出現消滅了一批工作崗位,而人類學會了使用機器又獲得了新的工作崗位;現在,對于人工智能的出現和發展也是如此。
我是非常推崇人機協作的。比如Band-in-a-Box、Hexachord提供給了音樂人很好的協作工具,人工智能寫作也應如此。
審視一部小說,特別是現在的網絡小說,其中會有一些獨創的東西,另外會有更多的雷同的東西。獨創的內容,如獨特的人物、人物關系、情節設計;至于雷同的內容,君不見,每部影視劇都會有很多類似的片段,如角色坐在一起吃飯聊天,在路上走動,飛車追逐……
獨創的內容,是作品的亮點,是作品成立的關鍵;而吃飯聊天走路開車這些片段,寫起來是浪費作家的時間和精力,最好能交由人工智能去做,人工智能也能做得更快。
在未來,人工智能寫作軟件應該要、應能做到,作家只需自己構思一些作品獨創的東西,別的交由人工智能去構建。其實我說的這些,跟現在人工智能音樂軟件的發展情況很相似。這是我對于人工智能寫作人機協作的愿景,也是更多其它領域人工智能發展未來的愿景。