靜電除煙機【專家推薦】餐廳業者安裝推薦，有了靜電機做生意油煙問題免煩惱－小藍鯨的網購推薦

柯潔能贏AlphaGo嗎？聽AI專傢馬老師解道 : 經理人分享

作者簡介：馬少平老師，清華大學計算機系教授，博士生導師，中國人工智能學會副理事長，中國中文信息學會副理事長。主要研究方向為智能信息處理，包括文本信息檢索、網絡用戶行為分析、個性化推薦、社交媒體分析等。透露兩個事實，其一，著名的亞一爬，梁博，Penny，梁斌博士，就是馬老師的PhD！其二，馬老師還是我們奧森十公裡的活躍成員，動不動就能以530配速跑十公裡。有想上人工智能博士的，好好和馬老師套套詞。本文馬老師授權轉發。

在2016年3月份，正當李世石與AlphaGo進行人機大戰的時候，我曾經寫過一篇“人工智能的裡程碑：從深藍到AlphaGo”，自從1997年深藍戰勝卡斯帕羅夫之後，隨著計算機硬件水平的提高，計算機象棋（包括國際象棋和中國象棋）水平有瞭很大的提高，達到瞭可以戰勝人類最高棋手的水平。但是，長期以來，在計算機圍棋上進展卻十分緩慢，在2006年引入瞭蒙特卡洛樹搜索方法之後，也隻能達到業餘5段的水平。所以AlphaGo戰勝韓國棋手李世石，確實是人工智能發展歷程上的一個裡程碑式的事件。

從人工智能研究的角度來說，計算機圍棋戰勝人類高水平棋手是一個標志，說明在某些方面，現有的人工智能技術可以達到怎樣的高度，所以當時我曾經認為人機再戰的意思已經不大，就如同當年深藍戰勝卡斯帕羅夫之後，IBM隨即馬放南山，即便卡斯帕羅夫提出再戰深藍，IBM也不再理會。當年的深藍還是一個專用設備，IBM甚至為瞭提高計算速度，而研制瞭專用的芯片（據說該芯片隻能用於下國際象棋）。但是萬事開頭難，隨著計算機計算能力的提高，今天即便在普通計算機上，也可以達到甚至超過當年深藍的水平。以至於在國際象棋比賽中，出現過棋手借去廁所的機會，讓計算機幫忙出招的醜聞，在現在的國際象棋比賽中，已經明確禁止利用各種計算設備，據說賽場也對網絡進行屏蔽，以防止有人作弊。

圖1. 深藍對卡斯帕羅夫的比賽現場

就在2016年即將過去的時候，在網絡上突然出現一個名為Master的計算機圍棋程序，在網上快棋賽中，連勝包括中日韓三國高手在內的人類棋手，取得連勝60場的輝煌戰績。事後得知Master就是AlphaGo的升級版。

為什麼AlphaGo會重出江湖呢？我想可以從AlphaGo與深藍的不同來考慮。深藍采用的是α-β搜索框架，加上大量的人類知識，在技術上已經沒有什麼發展空間。而AlphaGo采用的是蒙特卡洛樹搜索框架，加上深度學習和深度強化學習。在這樣一個框架下，深度學習，尤其是深度強化學習在計算機圍棋上的天花板究竟有多高？還是一個未知數，從技術的角度來說，還有很大的研究空間，我想這是AlphaGo重出江湖的重要原因，圍棋在這裡隻是作為一個應用對象，目的還是研究強化學習等方法。

靜電機

順便在這裡說一下，有人認為AlphaGo的成功是深度學習的勝利，我認為這一看法是片面的。具體來說，蒙特卡洛樹搜索引入到計算機圍棋中，是一個很大的飛躍，深度學習和強化學習的引入，是又一次飛躍。因此AlphaGo的成功是蒙特卡洛樹搜索加深度學習的勝利。如果再上升一個層次來考慮，則是人工智能中傳統的符號主義加連接主義的成功。如果再進一步上升一個層次，則是理性加感性的成功。因此，在今天深度學習大熱的情況下，不能忽視傳統方法的作用。傳統方法與深度學習具有互補性，應該加強這方面的研究，而不是一窩蜂式的湧向深度學習。

圖2. 韓國棋手李世石對戰AlphaGo

那麼這次的Master與去年3月份的AlphaGo有什麼不同呢（為瞭敘述方便，下文中AlphaGo特指去年3月的版本，Master特指現在的版本）？到目前為止，DeepMind公司還沒有透露出任何信息，隻能從表面現象去分析、猜測。我並不懂圍棋，為瞭瞭解Master的特點，在網上看瞭不少專業棋手對Master棋譜的分析，一個突出的感受是，Master常常會走出一些超出職業棋手想象的驚人之步，很多高手連呼看不懂，但又找不出其破綻。古力在其微博上說，Master的出現“已經徹底顛覆瞭我們棋手對局勢原有的掌控、判斷”，柯潔也評論說Master“給我們棋手帶來的震撼”。雖然AlphaGo也有出乎職業棋手意外的著法，但是這次Master這樣的走法更多，更出乎意外。鑒於此，我曾經給出一個猜測：“AlphaGo訓練時用到瞭16萬人類棋譜，加上自己左右互搏產生的3000萬棋譜，以及人類總結的幾萬個模式。而這次的Master很可能是從0開始學習得到的結果（指沒有利用任何人類棋譜和知識，依靠基於強化學習的左右互搏進行學習），在蒙特卡洛搜索樹的框架下，加上深度強化學習方法，是可以做得到的。這也是為什麼Master讓職業棋手感覺到被顛覆的原因，因為沒有任何人類的影響。AlphaGo在去年3月時雖然驚人的走法，但好像沒有這次多，也沒有這次大膽，因為3月的AlphaGo利用瞭16萬的人類棋譜和數萬個人類總結的模式”。雖然事後DeepMind公司說Master還是用瞭人類棋譜，但是很可能更加加強瞭基於強化學習的左右互搏的成分，弱化瞭人類棋譜的作用。事實上，DeepMind公司也確實在試探從0學習的系統，雖然還沒有推出。

在我的“人工智能導論”課上，學生要完成一個大作業，就是實現一個簡單的下棋程序，最初幾年，學生基本是采用α-β剪枝的方法，要自己總結很多模式出來，後來漸漸的采用蒙特卡洛樹搜索方法的同學逐年增加，到現在基本沒有同學用α-β剪枝方法瞭，也不再需要人為總結什麼模式瞭，基本都是從0開始，而且水平也是逐年提高，絕大多數同學都難於戰勝自己的程序。當然，大作業的棋類比較簡單，遠遠無法跟圍棋比，但是越來越不依賴於人類棋譜、知識，應該是一個發展趨勢，圍棋也應該可以實現，可能還需要更強大的計算平臺的支持。關於大作業，我曾在2013年的博客中有過簡單的總結，表明過類似的看法，有興趣的讀者可以參見《由大作業想到的》這篇博客http://blog.sina.com.cn/s/blog_73040b820101bwrl.html。

深藍、沃森和AlphaGo都可以算是人工智能發展史上裡程碑式的事件，那麼他們之間有哪些相同與不同呢？

關於相同點，我想可以總結為一句話：在一個特定領域，利用人類提供的數據或者知識，采用已有的技術，戰勝該領域最高水平的人類。

深藍是一個國際象棋程序，采用的是60年代就提出的α-β剪枝算法，IBM公司聘請瞭若幹個國際象棋特級大師總結下棋的模式和知識，用於對局面的評估。最終於1997年戰勝瞭連續10年國際象棋世界冠軍卡斯帕羅夫。

沃森是IBM為瞭紀念公司成立100周年研發的一個問答系統，其名稱是為瞭紀念IBM公司的創始人ThomasJ.Watson先生。2011年在美國最受歡迎的智力競猜電視節目《危險邊緣》中，沃森擊敗該節目歷史上兩位最成功的選手肯-詹寧斯和佈拉德-魯特，成為《危險邊緣》節目新的王者。在沃森系統中，共采用瞭100多項與自然語言處理、知識問答相關的技術，利用《危險邊緣》節目創始以來40多年的問題與答案進行訓練，存儲瞭大量圖書、新聞和電影劇本資料、辭海、文選和《世界圖書百科全書》等數百萬份資料，在3秒內可以給出一個問題的答案。

圖3. 沃森參加電視節目《危險邊緣》，中間是沃森，兩邊是肯-詹寧斯和佈拉德-魯特

AlphaGo在蒙特卡洛樹搜索的框架下，利用深度學習和強化學習技術進行訓練和評估，其中用到瞭人類棋手以往的16萬盤棋譜，以及AlphaGo自己左右互搏產生的3000萬盤棋譜，並用到瞭人類總結的幾萬個模式，綜合運用這些技術，實現瞭高水平的圍棋程序，並於2016年3月以4:1的成績戰勝瞭韓國圍棋職業高手李世石。這些技術也並不是新技術，但是DeepMind公司有所創新，主要包括兩個方面，一個是發展瞭強化學習技術，二是將傳統的搜索技術與深度學習在圍棋這個平臺上，很好地結合在一起，實現瞭理性與感性的良好融合。這可能是AlphaGo成功的關鍵所在。

這是他們共同的部分，那麼這三個系統有哪些不同呢？三個系統完全是三個不同的領域，不同點自然很多，下面隻從技術是否通用，以及通用程度方面展開討論靜電除煙機。

深藍采用的α-β剪枝算法是專門用於雙人博弈問題的算法，雖然也有人將該方法用於其他方面，比如故障診斷的測試點選擇，但應用面是非常有限的，是一個非常專用的算法。也曾聽有人介紹說IBM會把相關方法用於風險投資，但事後也沒有聽到相關消息。這也可能是IBM不再繼續投入開展研究的原因吧？

AlphaGo則有很大的不同，深度學習是個通用方法，已經在很多領域得到很好的應用，強化學習也具有一定的通用性，並且DeepMind對其有所發展和創新，在圍棋這個平臺上可以繼續開展研究，也可以推廣到其他領域。但是圍棋這類博弈遊戲有一個特點，其最終的勝負可以自動判斷，不需要人類標註，這就為系統自身的左右互搏、強化學習提供瞭很大的便利條件，如果在其他領域應用，需要定義合適的優化條件才可行。

在三個裡程碑式的事件中，我認為最具通用性的是沃森，它采用瞭100多項與自然語言處理、知識問答相關的技術，這些技術可以在很多應用領域發揮作用，不僅僅是用於問答，IBM公司把相關技術稱之為認知計算。IBM公司以此為契機，成立瞭沃森集團，專註於認知計算的研究和應用，已經在醫療健康領域取得瞭很好的成果。

因此，從通用性和商用性的角度來說，三個系統中排名第一的是沃森，其系統隻要結合相關領域的數據，可以很快進行商用轉化，提供服務；其次是AlphaGo，直接轉換到其他領域，提供商用服務的可能性不大，但其技術可以應用於其他領域；排在最後的就是深藍瞭，向其他領域轉化的可能性很小。

AlphaGo（包括Master）的出現，對於圍棋有什麼影響呢？有人認為這會毀瞭圍棋，人類根本就戰勝不瞭機器，再學習圍棋還有什麼意義呢？我認為這種看法是不正確的。AlphaGo的出現，說明人類對圍棋的認識遠遠不夠，在計算機的輔助下研究圍棋，必將對圍棋有新的認識，就如同當年吳清源先生的出現一樣，即將開啟圍棋的新天地。

其實圍棋界也有類似的認識。職業棋手古力說，“我深深地感受到圍棋的神秘，似乎‘大師’（指Master）給我們打開一道圍棋的神秘之門。不論勝負，人類與人工智能共同探索圍棋世界的大幕即將拉開，新一次的圍棋革命正在進行著”。職業棋手排名第一的柯潔也提到，“人類數千年的實戰演練進化，計算機卻告訴我們人類全是錯的。我覺得，甚至沒有一個人沾到圍棋真理的邊。但我想說，從現在開始，我們棋手將結合計算機，邁進全新的領域、達到全新的境界。新的風暴即將來襲，我將盡我所有的智慧終極一戰！”

從科學發展史上來看，每次危機的出現，都預示著新的革命即將開始，比如數學上的幾次悖論的出現，都孕育出新的數學方法，極大地推進瞭數學的發展。我們期待著AlphaGo能開放出來，可以讓棋手們自由地與它對弈，甚至可以像圍棋復盤一樣，和計算機一起探索可能的走法，勝負已經不是關鍵，重要的是發展新的圍棋理論，讓圍棋走向一個新天地。

（下載iPhone或Android應用“油煙處理機價格經理人分享”，一個隻為職業精英人群提供優質知識服務的分享平臺。不做單純的資訊推送，致力於成為你的私人智庫。）

作者：佚名
來源：待字閨中

rmb253i2d6

小藍鯨的網購推薦

rmb253i2d6 發表在痞客邦留言(0) 人氣()

E-mail轉寄

小藍鯨的網購推薦

小藍鯨的網購推薦

靜電除煙機【專家推薦】餐廳業者安裝推薦，有了靜電機做生意油煙問題免煩惱

歷史上的今天

留言列表

站方公告

活動快報

遊山玩水趁現在！

我的好友

熱門文章

文章分類

最新文章

最新留言

動態訂閱

文章精選

文章搜尋

新聞交換(RSS)

誰來我家

參觀人氣

QR Code

POWERED BY

小藍鯨的網購推薦

小藍鯨的網購推薦

靜電除煙機 【專家推薦】餐廳業者安裝推薦，有了靜電機做生意油煙問題免煩惱

歷史上的今天

留言列表

站方公告

活動快報

遊山玩水趁現在！

我的好友

熱門文章

文章分類

最新文章

最新留言

動態訂閱

文章精選

文章搜尋

新聞交換(RSS)

誰來我家

參觀人氣

QR Code

POWERED BY

靜電除煙機【專家推薦】餐廳業者安裝推薦，有了靜電機做生意油煙問題免煩惱