上週電腦資訊界最夯的新聞是AlphaGo對戰韓國圍棋九段棋手,對圍棋沒有特別興趣的我也會關心這場盛事,除了因為現在的人工智慧讓我好奇程度已經發展到哪,更由於AlphaGo的作者是我的師大資工的學長黃士傑,讓我想起還在大學和研究所時和他互動的情景,他認真地當林順喜老師的課程助教讓我深感他如此敬業,相較我曾當過阿喜的高等演算法助教,可是就沒有他那麼熱誠,還會額外找時間教導學弟妹課業相關問題!
士傑學長給我的感覺是非常務實,我研究所時去系館找我前女友,在走廊遇到他,他看到我就知道我要去找阿文(我前女友最後一個字跟我一樣),然後就示意我她人在研究室,對了,當時阿文的研究室跟士傑學長同一間,所以很多資工相關的問題有時候她會請教士傑學長。
我和前女友碩士畢業同時也是士傑學長博士畢業,那時阿文和我想邀約士傑學長夫妻一起吃飯,畢竟他有意無意指導我們許多資工問題,但是賢伉儷正準備要離開台灣,很可惜沒有一起吃飯聊天,聽君一席話勝讀百卷書。
不過老實說,當時的我不懂得把握機會,好好請教士傑學長更多未來職涯的方向,說不一定可以縮短我嘗試錯誤的時間,甚至跟他一樣還沒畢業就被國外機構挖去當研究員!

AlphaGo能短時間內提升能力的三個關鍵
士傑學長在DeepMind工作兩年後被Google收購令人可喜可賀,更沒想到AlphaGo能代表Google挑戰韓國圍棋九段棋士李世石,就因為士傑學長在圍棋上的興趣付諸於電腦人工智慧,據阿喜說他曾經每天花16小時在寫圍棋程式,棋力是業餘六段的他在碩士班兩年、博士班七年間不斷研究如何讓他的圍棋程式Erica更上一層樓,總算在畢業之前打敗當時全世界最強的圍棋程式Zen,於是我才肯定AlphaGo士傑學長貢獻度至少佔50%,也很高興地看他代替AlphaGo執棋與李世石對弈。

圍棋的複雜度高達10的170次方
蒙地卡羅樹搜尋法聽起來好熟悉,那不就是高等演算法課時阿喜有時會提到的演算法,印象中我們有個作業要用它實作呢!
我想一個人之所以能徹底發揮潛力,除了天資聰穎之外,還要靠後天努力,我相信士傑學長擁有這兩項因素。此外,博士班畢業後的他到DeepMind這家專門研發遊戲人工智慧的英國公司,學習這家公司的經驗後肯定能讓他的Erica不斷提升等級,比如讓Erica有自我學習能力;再來被Google併購,因而可利用強大的硬體技術後援。想起阿喜提到要出國比賽前,會思考要帶怎樣規格的電腦,因為程式的能力某種程度上取決於硬體規格。

五場對奕中的第四場AlphaGo輸了。
回想小時候自己也熱衷玩遊戲,時常喜歡跟電腦對戰,因為不會像人那樣令人討厭XD~當然也時常破解電腦的策略,讓我很有成就感呢!通常在破解的時候,我會預料電腦的下一步甚至下好幾步的行為舉止,中途就會採取讓電腦無法預測的攻勢。同樣我看AlphaGo與李世石對戰,彼此一定有預測對方棋路的能力,而AlphaGo之所以勝出,大概是走出讓李世石無法預料到的步法,比如AlphaGo走出下十步會用到的一子,而李世石頂多能預測下九步,所以AlphaGo這神來一步就是勝出的關鍵之一。
之後隨著自我學習能力提升,無論是增強軟體(演算法、棋譜)或硬體(分散式電腦),AlphaGo肯定能完勝全世界圍棋第一名的人類棋手!
以上是個人的淺見,對親愛的士傑學長致敬。
話說,Erica是學長太太的名字呢!
最後想提一個演算想法,圍棋棋盤總共有361(19×19)格,它有361!個可能,約等於10的170次方,這是個天文數字,若用窮舉法不知道要幾億年。有趣的是可以類比人生,我們人生有無限多種可能,每個人都有自己想要走的路,所以要有策略性地去選擇,可以根據他人的經驗或自己的智慧。
如果用電腦資訊演算法來思考,我先前文章削減與搜尋 (Prune and Search)有解釋是切割與征服 (Divide and Conquer)的特例。若只是切割與征服會耗費很多時間去嘗試錯誤,然若能削減與搜尋必能縮短嘗試錯誤的時間,就能比一般人更早找到人生任務,那關鍵就是清楚知道自己要的是什麼,把多餘的可能恰當地捨棄,專注在對自己有益的部分上。
2016/6/6更新:
2016師大傑出校友黃士傑
參考:
- 淺談Alpha Go所涉及的深度學習技術
- Facebook 研究員解析演算法技術:AlphaGo 為什麼這麼厲害?
- 人機大戰再敗 李世乭:AlphaGo讓我開始挑戰對圍棋的傳統想法
- 「戰勝自己」不只是口號──《Nature》AlphaGo論文讀後感
- 從認知心理學角度看AlphaGo
- AlphaGo既不是起點也不會是終點,從頭述說人工智慧走過的這70年
- 幫 AlphaGo 擊敗南韓李世乭的那個人:台灣資工博士黃士傑
- Introduction to Monte Carlo Tree Search
- How AlphaGo Works
- How Alpha Go Work
- 用十分鐘瞭解 《電腦到底是怎麼下棋的》
- 用十分鐘瞭解 《AlphaGo的幾個可能弱點》
- 資工所博士黃士傑擔任GoogleAlphaGo幕後推手 擊敗南韓棋王李世石
黃士傑是DeepMind團隊中重要成員,和David Silver並列首席設計師,他也是DeepMind今年1月於科學期刊「Nature」發表人工智慧AlphaGo研究論文的第一作者之一,是影響AlphaGo發展的關鍵人物。黃士傑本身也是圍棋好手,2007年讀師大時就已經具有圍棋業餘6段資格,也是師大圍棋社創社社長。黃士傑專精於人工智慧領域,他的碩博士論文都在師大資工所教授林順喜教授指導下完成,分別是2003年碩士論文《電腦圍棋打劫的策略》和2011年博士論文《應用於電腦圍棋之蒙地卡羅樹搜尋法的新啟發式演算法》,博士論文中Rémi Coulom為共同指導教授。林順喜老師表示,黃士傑(英文名Aja)留在他的實驗室長達十年,唸完兩年碩士班,先當國科會研究助理一年,接著考上博士班,原本第五年就可畢業,但他為了延續研發成果,多留了兩年在師大,也爭取了多項佳績,2010年唸到博七時,黃士傑所開發的圍棋程式「Erica」甚至擊敗了當時圍棋AI公認最強程式「Zen」,並在日本舉辦的「國際電腦奧林匹亞競賽」中榮獲19路電腦圍棋金牌。
因為有這些好成績,林順喜說,民國100年6月底,黃士傑一通過博士論文口試,7月1日就被挖角,飛到加拿大的大學擔任電腦圍棋程式研究員。一年後被英國一家專門研究人工智慧深度學習的公司「Deep Mind」延攬,2014年「Deep Mind」被Google併購,黃士傑是兩位首席工程師之一。林順喜回憶,Aja在校時就很努力,加上對圍棋有興趣,也是台師大圍棋社創社社長,身為Aja的老師,覺得師大栽培出的學生,能為校爭光,甚至為國爭光,與有榮焉。
林順喜說,黃士傑這10年來,非常勤快地研發,經常透過視訊跟國外的高手們討論,每天研發程式幾乎超過10小時,有時甚至超過16小時,都是在做這一支程式「Erica」,而「Erica」就是黃士傑太太的英文名字。國外論文介紹「Erica」時,也會寫出「His Wife」。以另一伴的名字命名的程式相當少見,就像「AlphaGo」顯然不是Google執行長老婆的名字。
身為AlphaGo的幕後研發人員之一,黃士傑先是為AlphaGo設計了「腦」,更親自坐到了棋盤上,做為AlphaGo的「手」,幫AlphaGo下棋。
- 我為什麼支持 AlphaGo:近距離觀察「AlphaGo背後推手」黃士傑
- 人腦電腦圍棋大戰 幕後推手來自台灣
- 20160310中天新聞 AlphaGo打敗棋王關鍵 台師大博士黃士傑
- Go Ratings
五場勝四場後AlphaGo世界排名第二!
- Google AlphaGo 主要開發者黃士傑:台灣人才技術不弱,就是缺乏信心
- AlphaGo 靠識破李世乭棋路致勝?台灣之光黃士傑回台,解密世紀人機大戰
- AlphaGo第四戰輸了、為什麼連黃士傑也不知道原因?
- AlphaGo推手黃士傑現身分享奪勝祕訣 │20160318 中視新聞LIVE直播
Comments on: "關於AlphaGo的想法" (2)
[…] 我倆聊到快10點,話說表定營業時間是到9點,真感謝老闆沒把我倆轟出來。但說真的意猶未盡,我們還有很多話題還沒聊呀⋯⋯像是我倆共同認識的士傑學長,最近兩年因為AlphaGo爆紅之後而聞名全世界。 […]
讚讚
[…] 我師大學長黃士傑近十年時間研究圍棋演算法,畢業後利用深度學習的方式來擴展比人類更深一層的思路,可參考我先前隨意寫的文章:關於AlphaGo的想法。 […]
讚讚