AlphaGo之父:下個版本會讓電腦從零開始學圍棋
- 來源:互聯(lián)網(wǎng)
- 作者:newtype2001
- 編輯:newtype2001
DeepMind創(chuàng)始人哈撒比斯
3月9日,谷歌人工智能AlphaGo戰(zhàn)勝韓國棋手李世石引起巨大轟動,美國科技媒體“The Verge”在比賽結(jié)束后對AlphaGo背后的DeepMind公司聯(lián)合創(chuàng)始人德米斯·哈薩比斯進行了長篇訪談,哈薩比斯談到了他對人工智能未來的看法。
以下是文章全文:
DeepMind的AlphaGo戰(zhàn)勝韓國傳奇棋手李世石,點燃了空前的對人工智能問題的熱情。但是,這家谷歌子公司的AlphaGo計劃卻遠遠超出了它自身 - 甚至可以說它本身都不是重點。作為DeepMind的聯(lián)合創(chuàng)始人,德米斯·哈薩比斯(Demis Hassabis)在本周早些時候表示,DeepMind要做出“智慧解決方案”,對此他有一些想法。
哈薩比斯自己走了個不尋常的路去達到人生目標,現(xiàn)在回想起來這卻是一個完美的道路。哈薩比斯是一個在智力奧林匹克競賽中5次獲得冠軍的國際象棋神童。他聲名鵲起則是年輕時在英國Bullfrog和Lionhead游戲開發(fā)公司工作,在那里他致力于開發(fā)一款類似于“主題公園”、“黑與白”的人工智能游戲,后來他成立了自己的工作室。哈薩比斯在00年代中期離開了游戲行業(yè)去讀完神經(jīng)科學的博士學位,2010年他與別人聯(lián)合創(chuàng)立了DeepMind公司。
在AlphaGo首次戰(zhàn)勝李世石后的清晨,哈薩比斯坐下來接受The Verge的訪談。他在進屋時評論著首爾四季酒店(注:比賽地點)的燈光布景,給人的感覺十分溫馨友好。當一個谷歌代表告訴他,昨夜有3300篇韓國媒體文章報道了他,他明顯看起來非常吃驚。 “這令人難以置信,對吧?”他說, “看到一個深奧難懂的事物開始流行起來,這很有趣。”
除了AlphaGo,我們的談話觸及視頻游戲、下一代智能手機助手、DeepMind在谷歌公司中的角色、機器人、AI如何幫助科研等等。
注:本次采訪內(nèi)容已被輕度編輯,以便于閱讀。
問:The Verge 記者薩姆·貝福德(Sam Byford):對于那些不了解人工智能或圍棋的人,你會如何描述昨天所發(fā)生的文化共鳴?
哈薩比斯:對于這些我要說幾點。圍棋一直是完全信息博弈的巔峰。它在可能性方面比國際象棋更復雜,所以它一直是人工智能研究領域努力尋求突破的重大挑戰(zhàn),尤其是在“深藍”之后。你知道,即使付出了很多的努力,我們還是沒有走出太遠。蒙特卡洛樹搜索是十年前一個很大的創(chuàng)新,但我認為我們成功地用AlphaGo給神經(jīng)網(wǎng)絡引入了“直覺”——如果你想這么叫的話,而正是這些直覺讓某些人成為頂尖棋手。我很驚訝,即使是現(xiàn)場解說邁克爾·雷德蒙德(Michael Redmond)也很難算出結(jié)局,他可是一個職業(yè)9段棋手啊!而這表明了你是有多么難寫出圍棋的“評價函數(shù)”(valuation function)。
問:當你看到AlphaGo的特殊舉動,你會感到驚訝嗎?
哈薩比斯:是啊。我們相當震驚,我認為李世石也是,從他的面部表情就能看出來。AlphaGo的那步棋深深地打入了李世石的領地。我認為這是一個相當意外的舉動。
問:是因為(這步棋的)侵略性嗎?
哈薩比斯:嗯,是因為侵略和大膽!此外,它在比賽中戲耍了李世石。李世石以好戰(zhàn)而聞名,這就是他所傳達出的,我們期待的那種東西。本場比賽一開始,他就在整個棋盤上求戰(zhàn),但是沒有一處是真的。傳統(tǒng)的圍棋程序在處理這種情況時非常無力。他們在局域計算中并不差,但是在需要通盤視野的時候會很無力。
問:舉行這次比賽的一大原因就是評估AlphaGo的能力,無論輸贏。你從昨晚學到什么?
哈薩比斯:好吧,我想我們了解到:我們已經(jīng)沿著這條線走出了很遠 ——沒有超出我們的預期,但達到了我們的期望。我們要告訴大眾,我們認為比賽是五五開。我認為這仍然可能是正確的,這兒任何事都有可能發(fā)生,我知道李世石今天回來后會采取不同的策略。所以,我認為尋找出對手策略將是非常有趣的。
剛才談到了AI的意義,回答了你的第一個問題。另一個我要告訴你的事情是,我們和深藍是不同的。深藍是一個“手工”程序——程序員從國際象棋的規(guī)則中提煉出信息和獲得啟發(fā)。而我們的AlphaGo擁有學習能力,它通過實踐和學習獲得知識,這更像人。
問:如果在系列賽中AlphaGo繼續(xù)以這種方式取勝,接下來會發(fā)生什么?未來會有一個人工智能的游戲?qū)Q嗎?
哈薩比斯:我認為作為圍棋是完全信息博弈的巔峰。當然,我們還有其他頂尖棋手要比賽。此外,其他的游戲 ——像無限押注的德州撲克就非常困難。多人比賽會有其他的挑戰(zhàn),因為它是一個不完全信息博弈。再有明顯的就是,人類在玩《星際爭霸》這類游戲時比電腦更好。戰(zhàn)略游戲需要在一個不完全信息的世界里擁有高層次的戰(zhàn)略能力。而圍棋的事情是很明顯的,你可以在棋盤上看到一切,因此,這對于電腦來說更容易一些。
問:(人工智能)打《星際爭霸》這些游戲你個人會感興趣嗎?
哈薩比斯:也許吧。我們只對研究項目主線范圍內(nèi)的事情感興趣。所以DeepMind的目的不只是打游戲,盡管那非常有趣而且令人興奮。你知道,我喜歡玩游戲,我以前編寫過電腦游戲。但是那僅限于作為測試平臺,用于嘗試寫出我們的算法思想和測試出它能到多高等級、能玩得多好,這是一個非常有效的方式。最終,我們希望能應用到現(xiàn)實世界中的重大問題。
問:90年代末,我在英國長大,當時我在電腦雜志上看過你的名字,你的名字常常和游戲聯(lián)系在一起。當我第一次聽說DeepMind,看到你名字時,我在想:“真是絕配。”之前你在游戲行業(yè)的職業(yè)經(jīng)歷對于現(xiàn)在所做的工作有何影響?
哈薩比斯:類似DeepMind的東西一直是我的終極目標。從某種意義上來說,我在這方面的計劃已有20多年時間。如果你從這種角度來看,即我所做的一切都是為了最終進軍人工智能領域,那么可以發(fā)現(xiàn)我的選擇是合理的。如果熟悉我在Bullfrog等公司的工作,那么你會知道,人工智能是我所做一切的核心。很明顯,(Bullfrog創(chuàng)始人之一)皮特·莫里諾克斯(Peter Molyneux)的游戲也都是人工智能游戲。
16至17歲時,通過開發(fā)《主題公園》,我意識到如果繼續(xù)發(fā)展人工智能,那么人工智能將發(fā)揮巨大的力量。我們賣出了數(shù)百萬個拷貝,而許多人都喜歡這款游戲。正是由于人工智能的存在,這款游戲才可以適應玩家。我們隨后繼續(xù)進行開發(fā),而我也在游戲行業(yè)的職業(yè)生涯中試圖繼續(xù)發(fā)展這一技術(shù)。
隨后,我退出了游戲行業(yè),回到了學術(shù)界,從事神經(jīng)科學的研究。因為在21世紀00年代中期,我感覺通過游戲這扇“后門”去展開人工智能研究已經(jīng)非常困難,因為游戲發(fā)行商只想要游戲。
問:當時,游戲是否是人工智能唯一顯而易見的應用?
哈薩比斯:是的,我認為是這樣。實際上我認為,當時我們正在開發(fā)技術(shù)極其領先的人工智能。我想說的是,那時學術(shù)界還停留在90年代,而所有新技術(shù)都尚未普及,也沒有得到大規(guī)模應用,例如神經(jīng)網(wǎng)絡、深度學習和強化學習。因此,最優(yōu)秀的人工智能技術(shù)存在于游戲之中。
當時的技術(shù)不同于我們目前開發(fā)的學習型人工智能,而更多的像是有限狀態(tài)機。但這些系統(tǒng)很復雜,并且具有自適應性。類似《Black & White》的游戲采用了強化學習技術(shù)。我認為這是到目前為止游戲中最復雜的人工智能應用案例。不過到2004至2005年,很明顯游戲行業(yè)走上了與90年代不同的發(fā)展方向。90年代的游戲很有趣,具有創(chuàng)新性。當你想到一個點子時,就可以將其開發(fā)出來。而到00年代,游戲更強調(diào)圖像、內(nèi)容IP,類似FIFA的游戲大行其道。因此,游戲行業(yè)不再有趣。
在游戲行業(yè),我做了能做的所有一切,在成立DeepMind之前我需要收集好必要的信息。這就是神經(jīng)科學。我希望從大腦解決問題的方式中獲得靈感。因此,沒有什么其他方式比攻讀神經(jīng)科學的博士學位更好。

玩家點評 (0人參與,0條評論)
熱門評論
全部評論