4月下旬,世界各路女子圍棋高手相聚第一屆“吳清源杯”,但似乎更加吸引棋迷目光的是世界各路機器圍棋高手云集的世界人工智能圍棋大賽,還有柯潔將參加的人機大戰表演賽。
距離柯潔與AlphaGo的人機大戰已經快過去一年了。這一年時間里圍棋界發生了很大變化,也許并不太懂棋的旁觀者還體會不到這一點,可是在圍棋職業高手和關注棋壇變化的棋迷們眼中,兩年前、一年前和現在的紋枰世界已經連升三級,大為不同了。要是讓2015年的柯潔穿越到今天,乍一看到最近比賽的棋譜,他恐怕要懷疑自己的眼睛以及多年所學了。
科技引領時代。人工智能對圍棋的探究源于機器學習技術,正是因為加入了深度學習神經網絡,AlphaGo有了與人類棋手相似的“棋感”、“形勢判斷”和“大局觀”,才能在硬件不需大突破的情況下,攻克了多年來停滯不前、很多專業人士預期二十年之后才可能實現的計算機圍棋難題。要知道,在引入機器學習技術之前,僅靠蒙特卡洛樹搜索和“專家知識數據庫”,計算機圍棋程序的水平只達到了被一流高手讓六子的程度,——這就是發生在AlphaGo與李世石的第一次人機大戰前半年的事情。
李世石與AlphaGo一戰,左邊代AlphaGo落子者為黃士杰博士
此后,在價值網絡和策略網絡被進一步融合為一體,AlphaGo進化為“大師”(Master)級,消除了算法中的漏洞,遠遠超過人類棋手目前的最高水平,棋界普遍評估大概在讓二子至三子之間。這是一個怎樣的差距呢?
目前,職業頂尖高手與業余頂尖高手之間的差距是讓二子至讓先之間。而業余頂尖與業余一流高手之間大概有讓先左右的差距。比職業頂尖高手略強的國產圍棋人工智能“絕藝”(上一版本)經常在網絡上測試與業余普通高手(大致在業余5段左右)的讓二子或讓三子棋,絕藝勝多負少。形象一點說,在大師版本的AlphaGo面前,職業頂尖選手大致有相當于博爾特與高中田徑隊尖子選手的差距。
而從零開始的AlphaGo Zero和通用棋類人工智能AlphaZero又比大師版本的AlphaGo更強大。其研發團隊的首席科學家大衛席爾瓦認為,這證明不依靠人類知識自己學習的人工智能可以達到超越人類、且在一定程度上通用的水平,算法比數據更重要。最新版本的Alpha Zero只需要在一臺單機、四個TPU上運行,而初代的AlphaGo需要龐大的硬件集群支撐,而棋力確實新版本遠強于舊版本,這是算法的勝利。
AlphaGo采用的技術——深度學習
介紹了這么多關于AlphaGo的技術,是因為在四月底要與柯潔進行人機大戰的圍棋人工智能是國產、且技術不同于AlphaGo的“神秘硅基棋手”。它的名字叫“星陣”,英文名是Golaxy,這個詞源于galaxy(星系、銀河),而Go是圍棋的意思。
星陣是圍棋的別名,與木野狐、爛柯、黑白、手談、方圓、坐隱等名稱一樣,都有典故。這款即將于柯潔對陣的圍棋人工智能以此為名,可見信心十足,也做了很多功課。據該項目的研發團隊透露,這個名字也與所采用的技術有關,而這個技術是迥異于AlphaGo采用的深度學習算法的。團隊里有精通圍棋的人才,也有精通人工智能技術的骨干,他們對自己研發的“星陣”信心十足,認為這會是一個里程碑。
不同于AlphaGo的星陣?
耳聽為虛眼見為實。對于星陣的棋力,我們不得而知,留待二十天后的實戰檢驗吧。如果星陣真的能走出一套不同于AlphaGo的路,無疑是很具價值的。因為當前能夠達到很高水平的幾款圍棋人工智能,都是采用了AlphaGo兩篇發表在《Nature》的論文所描述的技術,頂多是在細節上略作發揮,大同小異。
雖說成功的路未必只有一條,但星陣的不同僅僅是標新立異,還是卓然不群,就讓柯潔這把烈火來試一試真金。其實最早在去年年底公布消息時,在這次世界人工智能圍棋大賽上,柯潔的對手被定為“天壤”,這也是一款國產的圍棋人工智能,采用了AlphaGo初代版本的技術,后有升級??聺嵰桓呐cAlphaGo大戰流淚后稱“不會再與人工智能下棋了”的口風,同意再戰機器棋手。希望能夠設定一個比較充足的用時,比如保留時間三小時,可以讓人類棋手更充分地思考。倘若是下快棋,人工智能的運算速度優勢會被放大,對人類棋手不利。