曝阿法狗今年將正式挑戰柯潔 Master未達到極限
肆虐了棋壇近一週後,“Master(大師)”脫下馬甲,宣佈暫時閉關。中國最火的圍棋對戰平臺弈城,在給AlphaGo保密了一週後,也放鬆了下來。這一週,AlphaGo和中國本土圍棋AI(人工智能)打擂,打出名頭,也留下被攪亂的圍棋世界;連高曉松等“圈外人”也在思索著被“大師”改變的人生。不過人生總要繼續,有消息稱,就在今年,谷歌AI會正式挑戰柯潔。
有保密 沒協議
弈城CEO李哲勇把“Master”身世的秘密守了一週,但他告訴北京青年報記者,谷歌並沒有和弈城簽任何書面協議。
去年12月29日,“Master”初登弈城。令人迷惑的是,他自稱來自韓國。李哲勇介紹,這是AlphaGo開發者放的煙幕彈,不希望棋手們這麼快猜出它的來歷。“畢竟還在測試,AlphaGo團隊開始想隱藏身份,於是就托我們註冊了一個韓國號。”李哲勇説。
為了方便挑戰棋手,弈城還為初登平臺的“Master”準備了九段帶P(職業)的號。李哲勇介紹,“他們團隊先找到我們的韓國合作方,想註冊個號,方便和職業棋手下棋。後來我這邊幫助註冊的。”
為什麼谷歌會選擇弈城?李哲勇説,黃士傑博士作為AlphaGo開發者之一,也是圍棋愛好者,“第一個想到我們很正常。所以這次也沒有簽什麼書面協議,就是私交不錯。只是要求別透露身份,只是約定,沒有正式協議。”
台灣出生的黃士傑博士,畢業于台灣師範大學,博士論文就是“應用於電腦圍棋之蒙地卡羅樹搜索法的新啟髮式演演算法”。他本身也是業餘六段,很早就在弈城下棋。這也解釋了在與“棋聖”聶衛平對弈結束後,“Master”為何用繁體字打出“謝謝聶老師”。
有煙霧 有“督戰”
一邊保守著秘密,弈城一邊為人機大戰造勢,先是在自己網站上發了含混的消息,後在圍棋貼吧裏發了含混的帖子。可隨著“Master”連戰連捷,圍棋的一切都在瞬間捲進了風暴。那一刻,谷歌創始人布林就身在北京。
這次來訪北京,布林並沒有公開自己的來意。有媒體透露,其身邊人稱他是來休假的,屬於個人性質的旅遊,結果引來了一陣調侃,“布林是不是沒看天氣預報……”
如今“Master”完成60連勝,職業六段棋手樊麾同時也是谷歌DeepMind團隊測試工程師,代表DeepMind團隊發表公告:“我們最近很努力地開發阿爾法圍棋,剛過去的幾天我們在網絡的對弈平臺進行了一些非正式的快棋對局,目的是為了檢驗我們最新版本的阿爾法圍棋是否如我們的預期。”
不費“一槍一彈”,谷歌進行了對升級版AlphaGo的測試。眾多中日韓頂尖棋手帶著對圍棋的熱愛,甘心充當了免費程式測試員。不過北青報記者了解到,就在今年,谷歌將邀請中國圍棋第一人柯潔正式和AlphaGo進行人機大戰。
AI打擂 棋手作陪
其實“Master”並非唯一“踢館”的AI。歲末年初,好幾個高水準圍棋AI現身弈城等平臺。借助各自對人類棋手的勝率,AI們也分出了高下。
表現最積極的當屬日本的Ddeepzengo,至今年1月3日,已經下了超過200盤棋,輸了20盤。雖然勝多負少,但主要是勝不帶P標誌的業餘棋手,對職業棋手輸得多,還沒有世界冠軍級棋手出手測試。
野狐圍棋的“絕藝”和“刑天”作為本土AI,更加引人注目。2016年11月上線的AI“絕藝”勝了柯潔一盤,5比1勝樸廷桓,但此後高手們摸清了“絕藝”的路數,柯潔對“絕藝”的戰績達到3比1。此後“絕藝”再沒下過棋,下線研發升級去了。
一個月後,升級版本“刑天”又上線開始下棋,對柯潔戰成5比2,對樸廷桓4比1。雖然“刑天”死活還是有問題BUG(漏洞),但職業棋手感覺其實力已和去年初的AlphaGo相當。
就在職業棋手們認為找到了“刑天”的漏洞就是找到所有AI的漏洞之時,“Master”的登場打消了棋手的念頭。人類一勝難求,“Master”早早領先10多目甚至20目以上,收官時再“讓”給人類一些目數保成4目半、2目半或者半目勝。參考人類棋手的成績,AlphaGo在這場AI打擂中更勝一籌。
從挑戰到學習
AlphaGo團隊選中弈城的重要原因,是這裡聚集了世界最頂尖的棋手和最多的棋迷。雖然“Master”穿著馬甲,但柯潔第一天就猜到了真相。
李哲勇對北青報記者表示,最開始弈城是對棋手保密的,包括對柯潔,但“Master”鋒芒太露,“我們除了提供了號,其他都不管。AlphaGo是自己挑對手的,結果上線第一天就是全勝,有的棋手不服氣,再下,又被切。到第二天,所有棋手就知道肯定是機器了。”
柯潔其實第一天就知道了真相。“因為在他了解的範圍,沒人這麼下棋,也沒人這麼厲害,他就去問了我們總經理,跟人家説告訴我吧,我肯定保密。我們經理回復説呵呵,不能説啊,他就自己感覺到了。”李哲勇説。
因為“Master”成績太過突出,棋手早已收起昔日的矜持,排隊等著“翻牌”過招。去年首次人機大戰,柯潔曾豪言“阿爾法狗贏不了我”,這次兩敗于對手後,柯潔醉心於對手別出心裁的棋路,以至於一夜不眠。而唐韋星敗于對手後則説,“朝聞道夕死可矣。”
有敬仰 有口水
60盤30秒一次的快棋對局,遠遠沒有逼出“Master”的極限,可也逼出了不少下限。一邊是對人工智能敬仰的口水,一邊是肆意踩踏職業棋手尊嚴的口水,這次人機大戰引發了別樣的風波。
比如高曉松就在微博上表示,“作為自幼學棋、崇拜國手的業餘棋手,看了Master橫掃中日韓頂尖高手的對局,難過極了。多少代大師上下求索,求道求術,全被破解。未來一個八歲少年只要一部手機就可以戰勝九段,榮譽信仰灰飛煙滅。等有一天,機器做出了所有的音樂與詩歌,我們的路也會走完。”
高曉松的微博“激怒”了唐韋星。後者回應道:“職業棋士就算下不過電腦也是你一輩子比不上的,別説手機,高考讓帶手機嗎?比賽也不會讓你帶的。真搞不懂有狗了就覺得職業棋士差的人是怎麼想的。”
某圍棋教育創始人這樣説:“頂尖職業棋手都認識到了,自己以為對的,其實都是錯的。自己以為的高明,其實都是笑談。老師,還是不懂的,最好。”
從求勝變求道
職業棋手一朝被機器打敗,弈城在考慮AI未來對自己平臺的衝擊,職業棋手則開始思考,被心中只有勝率和演算法的機器打敗後,是不是説明圍棋在求勝之餘也有求道之路需要探索。
高曉松的話逆耳,卻吻合專家的預言,比如圍棋比賽的網絡預選賽制將很難再搞。這只是信念危機,還有信任危機。李哲勇説:“下棋本來是公平對決,如今要是大家都不再相信對手,都猜疑對手會使用AlphaGo作弊,怎麼辦?”
好在,人工智能的衝擊也讓圍棋人想起求道之路。“當今活躍的一流棋手,幾乎都在弈城上從小練棋成長,包括柯潔,從小孩開始,就用‘潛伏’這個用戶名在這上面練棋。這裡仍是棋迷們手談、心靈交流的平臺,這種情感不是一場勝負可以取代的。”李哲勇説。
但求勝仍是職業棋手的終極目標。轉換思路,如今打敗了棋手的AI,也正是棋手探索圍棋未知領域的最佳助手。陳耀燁兩盤不敵“Master”後説,下了還想再下。他認為與AI過招,正是有利於打破思維定式的訓練方式,“AI錯誤更少,如果將來有單機版能用於訓練的話,以後訓練模式肯定會不一樣。越接觸AI越感到圍棋的深奧,未來提升空間很大。”
同樣樂觀的還有柯潔。他説:“人類數千年的實戰演練進化,計算機卻告訴我們人類全是錯的。我覺得,甚至沒有一個人沾到圍棋真理的邊。但我想説,從現在開始,我們棋手將結合計算機,邁進全新的領域,達到全新的境界。”面對AI來襲,擁有樂觀和開放的心態,這至少是一個好的開始。