登錄×
電子郵件/用戶名
密碼
記住我
AlphaGo

AlphaGo設計師黃士傑:「最強的學習技能在人類的腦袋裡」

AlphaGo的「人肉手臂」、擔任Deepmind資深研究員的黃士傑,在近期公開演講中,分享他身為一名科學家,如何旁觀機器的進步。

沒有人會否認,AlphaGo在過去一年炒熱全球對人工智能的關注。

2016年3月,谷歌Deepmind旗下的圍棋程序AlphaGo,以4比1的成績戰勝韓國職業棋手李世石。一年後,拿掉所有人類知識、完全靠自學的AlphaGo Zero,在今年10月又以100比0的戰績碾壓「AI前輩」AlphaGo。從擊敗人類、到自學成材,AlphaGo的進展超乎預期,研發團隊也自然成為關注焦點。這當中,被稱為AlphaGo的「人肉手臂」,替AlphaGo向棋聖聶衛平說「謝謝聶老師」的黃士傑(Aja Huang),就是AlphaGo發展的重要推手。

1978年出生、現任Deepmind資深研究員的黃士傑,私底下是圍棋業餘六段,在每一場人機對戰中,都代表AlphaGo落子。但他不只是手腳,更貼近他身分的描述,其實是AlphaGo的設計者、是AlphaGo的大腦。讓AlphaGo登上科學期刊《自然》(Nature)封面的那篇知名論文,黃士傑並列為第一作者。

上周五(11月10日)在台灣中研院舉辦的「2017年人工智慧年會」上,黃士傑首次把AlphaGo的研發過程公開說清楚,除了透露新一代AlphaGo Zero的能力還沒達到極限,他更多的是去分享身為一名科學家,旁觀機器的進步,以及一個科學團隊對基礎研究的使命和專註。

以下是編輯後的演講摘錄:

AlphaGo的研發過程,有四個時刻對我影響很大。

第一,是我們在韓國贏了李世石。當我們開始做AlphaGo時,沒想到它會變得那麼強。在韓國贏了李世石後,DeepMind首席執行官Demis Hassabis立刻發了一個推特,說「我們登上月球」(We landed it on the moon.)。我明白Demis那天的感覺,這是我們團隊的一小步,但卻是人類的一大步。

第二個時刻,是我在網絡上操作AlphaGo升級版「Master」,下了60盤棋。我從小喜歡下棋,在台灣是業餘六段。Master在網絡上對弈的對象,都是我從小崇拜的人。雖然不是我真正在下棋,但卻感到非常榮幸。

第三個時刻,是今年在烏鎮進行的人機大戰,由我操作AlphaGo和世界冠軍柯潔九段下棋。柯潔還不滿20歲,非常年輕,當天比賽氛圍和李世石對弈時很不同。我記得在韓國比賽,能感受到李世石承受到很大的壓力,感覺他是在為人類而戰。我當時坐在他對面,也盡量保持謹慎的態度,不喝水、不去上洗手間。但到了第二次和柯潔對弈,比較像是人機合作的氣氛,柯潔還走過來說:「黃博士,很榮幸跟AlphaGo下棋」,坦白說我有點驚訝。這也讓我們知道,如果Master是無敵的,那機器存在價值到底在哪裡?應該是要幫助棋手擴張思路、擴展圍棋理論。

第四次對我意義重大的時刻,是AlphaGo Zero的出現。什麼是AlphaGo Zero?我們拿掉所有人類對圍棋的知識,只喂AlphaGo Zero圍棋規則,讓它自己學習下棋。我回想起讀博士班的熬夜日子,就是不斷寫代碼、找bug,每天做測試,讓程序進步。但AlphaGo Zero把我過去的所有東西全部取代,它完全不需要我的幫助。有同事問我,Aja,AlphaGo Zero把你這十幾年來對圍棋計算機的研究,一點一點的拿掉,甚至還超越你,有什麼感覺?我的確心情複雜,但後來跟同事說,這會是一個趨勢,如果我阻礙了AlphaGo,我確實應該被拿掉(笑)。AlphaGo有99%的知識是我做的,AlphaGo能走到這一步,我已經很滿足,找到了收尾。

讀者評論

FT中文網歡迎讀者發表評論,部分評論會被選進《讀者有話說》欄目。我們保留編輯與出版的權利。
用戶名
密碼

相關文章

相關話題

FT中文網客戶端
點擊或掃描下載
FT中文網微信
掃描關注
FT中文網全球財經精粹,中英對照
設置字號×
最小
較小
默認
較大
最大
分享×