電影,電視劇 · 觀念,思考

『鴻觀』第77期『人類恐將被機器統治 ?』 觀後感

8.png

http://v.youku.com/v_show/id_XMTUwMjk1NjUwOA==.html?from=s1.8-1-1.1

宋鴻兵最近一期(77期)的『鴻觀』主題是『人類恐將被機器統治 ?

提到最近一條熱門新聞『AlphaGo戰勝圍棋高手李世石』

其實過去1997 年,IBM 的深藍戰勝西洋棋世界冠軍Garry Kasparov 之後

當時《時代雜誌》提出,讓電腦與人類下圍棋吧,它獲勝的機會很小

沒想到,相隔不過20年,《時代雜誌》就被打臉了

而這次AlphaGo戰勝李世石之所以會這麼受到矚目,是因為挑戰項目的差異性

 

在鴻觀裡面談到,過去深藍挑戰西洋棋所採用的方法是『暴力演算法』

也就是說,深藍將西洋棋所有的棋路都算過,然後挑出最好的棋步

『暴力演算法』用在西洋棋可行,但是若要用在圍棋那恐怕就不行了

因為西洋棋每一步有30種可能性,但是圍棋卻有250種可能性

有人估計圍棋所有可能的變化大約是10的171次方,這是天文數字

即使以現代的的電腦要去窮盡所有的棋路,那每走一步不知道要等多久

既然圍棋棋局千變萬化,棋步達到天文數字,不可能逐個運算

那AlphaGo對的又如何知道哪些棋步可取,哪些棋步不應考慮?

 

此次AlphaGo團隊不再採用『暴力演算法』,而改用『類神經網路』

『類神經網路』的說明我建議直接看『鴻觀』宋鴻兵的說明

當然了,類神經網路也只是另一種演算法,重點是如何運用

關鍵在於AlphaGo有兩個網絡,策略網路以及價值網路

這有點像是人類的左腦(管理性)跟右腦(管感性)

 

第一個大腦『策略網路』基本上就是一個單純的監督式學習

用來判斷對手最可能的落子位置

它完全不用去思考「贏」這件事,只需要能夠預測對手的落子即可。

 

第二個大腦『評價網路』則是關注在目前局勢的狀況下

每個落子位置的「最後」勝率(也就是所謂的整體棋局),而非是短期的攻城略地

 

也就是說策略網路是分類問題(對方會下在哪)用來收窄闊度,只考慮可能步法

評價網路是評估問題(我下在這的勝率是多少)用來減少深度

不會完全演算到棋局終結,到某一個位置就會評估勝負的機率

如此避免永無止境的運算下去,才能在限時的圍棋場上與人較量

 

至於AlphaGo如何決定收窄步法呢?就得靠學習

AlphaGo團隊首先蒐集大量的棋譜,研習高手3000萬棋步

第二步就是自我超越,在避免重覆對戰的前提下與自己對弈

每次獲勝就成為一次增強學習,以後判斷更準

這有點像是周伯通的『左右互搏』(這樣又做了100萬次練習)

透過這樣大量的深度學習來提升它的圍棋功力

練習棋譜3000萬棋步,加上跟自己對打100萬次

你想想人類有可能做到這樣嗎 ? 也難怪李世石會輸

 

李世石有沒有贏的機會? (以下引用尹相志之文章內容)

在很多評論中,我覺得對於AlphaGo都有很多不正確的猜測

首先是AlphaGo有沒有「整體棋局」評估的能力

必須說的是以整台AlphaGo來說是有的………

但是人類對於「整體棋局」的掌控是透過直覺,這一點應該還是比電腦強大

 

如果李世石有辦法利用AlphaGo會預測他的行為做後面決策

作出陷阱,來製造勝率評估的誤區那麼人類就有可能獲勝

但是知易行難,這樣實際執行可能性是偏低的

 

現在李世石必輸的原因在於它一直在猜測AlphaGo的棋路

但是事實上反而是AlphaGo一直在靠猜測李世石的下一步來做決策

所以他應該改變思路,透過自己的假動作來誘騙AlphaGo,才有勝利的可能性

 

人類有沒有可能被機器統治 ?

宋鴻兵的答案是沒有可能,因為這種人工智能它有一項根本性的矛盾

就是你棋下的越好的這個學習網路,它的通用性越差

AlphaGo根本就是為了下圍棋所設計出來的人工智慧

如果要拿它來解決其他問題,勢必神經結構以及算法都必須要重新設計

換句話說,如果不修改AlphaGo原本的電腦結構

我立刻跟AlphaGo比象棋,是有可能會贏的呦 ^ o ^

當然這個關於未來的問題頗複雜,我也沒資格多說什麼

還是建議各位直接去看視頻吧

 

最後,我比較好奇的是

如果AlphaGo團隊把這套理論用在市場交易的話,不知效果會如何

真希望有一套專門搞交易的AlphaGo啊 ^o^

 

上文部分內容參考尹相志所分享之《淺談Alpha Go所涉及的深度學習技術》

http://www.bnext.com.tw/article/view/id/38923

以及陳奕謙所分享之《解構AlphaGo圍棋神功:師承天下棋手 精通左右互搏》

http://www.hk01.com/%E5%9C%8B%E9%9A%9B/12021/%E8%A7%A3%E6%A7%8BAlphaGo%E5%9C%8D%E6%A3%8B%E7%A5%9E%E5%8A%9F-%E5%B8%AB%E6%89%BF%E5%A4%A9%E4%B8%8B%E6%A3%8B%E6%89%8B-%E7%B2%BE%E9%80%9A%E5%B7%A6%E5%8F%B3%E4%BA%92%E6%90%8F

廣告

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com 標誌

您的留言將使用 WordPress.com 帳號。 登出 /  變更 )

Google+ photo

您的留言將使用 Google+ 帳號。 登出 /  變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 /  變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 /  變更 )

連結到 %s