欧美日韩国产精品va|亚洲国产精品综合欧美|国第二产在线无码精品区|亚洲国产精品VA在线播放|日本一区二区三区最新视频|日韩在线高清一区二区三区|老子午夜精品888无码不卡|亚洲国产精品高清免费在线观看

云服務(wù)

熱門搜索: 防爆監(jiān)控 電動機(jī) 防爆暖通 防爆風(fēng)機(jī)

首頁 行業(yè)資訊 政策解讀 電商會議 人物觀點(diǎn) 電商數(shù)據(jù) 電商干貨 電商報 博文資訊 客戶庫 企業(yè)庫
首頁>新聞詳情

漫談人工智能之二,Master粲粲如星,揮灑縛豪英

2017年3月8日 來源:天云聚合B2C2B--亞洲最大、最安全的網(wǎng)上交易平臺 瀏覽 365 次 評論 0 次

國內(nèi)的人工智能熱很大程度上就是被AlphaGo炒起來的。機(jī)器圍棋和哥德巴赫猜想、費(fèi)爾馬大定理一樣,是一道舉世公認(rèn)的難題。圍棋361個點(diǎn),一盤棋的變化數(shù)目據(jù)說超過了宇宙中的原子數(shù)目,和其他博弈游戲相比是高出幾十個數(shù)量級的差別。

  在我看來,圍棋規(guī)則異常簡單:“交替落子,氣盡棋滅”,卻暗含宇宙中生命之妙。你看一個19路棋盤宛如蒼茫大地,黑白棋從無而始,兩支生命交替生長;中盤取勢占地,扭殺守御,皆為棋子生存繁衍。一局終了,棋譜留世。圍棋作為古人發(fā)明的智力游戲,妙處實不可言狀。千萬年后即使地球毀滅,外星來客若找到一張高手遺譜,我覺得他們大致可以探知人類當(dāng)時所擁有的計算能力和智力水平。

  AlphaGo的核心算法早已在Nature雜志上發(fā)表,解讀的文章也很多?;旧暇褪钦fAlphaGo團(tuán)隊通過喂了狗狗幾十萬盤人類對局,讓狗狗學(xué)會了下棋,到了一定水平后狗狗自己和自己下棋就能漲棋,水平會越來越強(qiáng)。

  果然,2016年底升級版阿法狗——Master橫空出世,在圍棋網(wǎng)站上小試牛刀,戰(zhàn)遍中日韓頂尖高手,求一敗而不得。更為可怕的是60連勝棋譜傳世之后,人類高手反復(fù)拆解,好像至今沒有人敢說在60局中有某一局的某一個時刻人類棋手有過明顯領(lǐng)先的時刻。從數(shù)學(xué)上講,如果(60局棋)X(每局200步棋)X(每步可能的變化數(shù))在這么大的概率空間里,人類高手都沒有明確的獲勝機(jī)會,那Master這個系統(tǒng)的水平和穩(wěn)定性可謂深不可測。

  作為深度圍棋愛好者,讓我震驚的是對局內(nèi)容。去年AlphaGo和李世石的棋譜其實還比較循規(guī)蹈矩,就算被媒體追捧的第二局五路尖沖“外星招法”,其實也并不算太出格。今年Master的棋就不一樣了,60局快棋中推翻人類棋手思維的下法簡直俯拾皆是。比如序盤很早就點(diǎn)三三,習(xí)慣性尖沖無憂角,對人類已經(jīng)沿用了幾十年的“妖刀定式”“大雪崩定式”的徹底改造,等等,給很多圍棋國手“要重新學(xué)圍棋”的觸動。打個比方,如果說去年的AlphaGo是集天下劍術(shù)之大成(畢竟剛剛從人類棋譜里學(xué)來)的高手,今年Master的感覺就已接近劍術(shù)通神的大師,手中無劍,天下萬物為劍,飛花摘葉退敵千里。Master新年一出場,就是風(fēng)清揚(yáng)、掃地僧這樣的世外高人范兒,輕輕松松饒?zhí)煜掠⑿垡幌取?

  舉個有點(diǎn)搞笑的例子,Master在對日本第一人井山的棋局中在右上角下出一步看起來很像初學(xué)者下出來的圍空棋,人類研究后認(rèn)為Master表示就這樣隨便下下就贏了,頗為推崇。事后替Master擺棋的“機(jī)器臂”黃士杰博士解釋是他連續(xù)在電腦前擺那么多盤棋太累了,鼠標(biāo)一滑擺錯位置的結(jié)果。雖然有點(diǎn)尷尬,不過的確說明Master隨便下下,中間打個盹歇一手也能追回來。

  大師是怎樣練成的?Master沒有公開任何信息,外面基本上沒有什么技術(shù)解讀。作為業(yè)余愛好者,權(quán)且說說我的看法。

  上一篇說了“深度子”的厲害,AlphaGo or Master不只是簡單用到了深度學(xué)習(xí)技術(shù),它用了兩個“深度子”的乘法效應(yīng)。具體而言,狗狗訓(xùn)練了兩個深度神經(jīng)網(wǎng)絡(luò),一個叫“策略網(wǎng)絡(luò)”負(fù)責(zé)學(xué)習(xí)人類的“棋感”,就是通過人類棋譜猜測棋盤上哪幾步是有可能的“下一手”,幫助計算機(jī)剪枝,把寶貴的計算資源用在刀刃上。另一個“價值網(wǎng)絡(luò)”負(fù)責(zé)做“形勢判斷”,就是計算在選用策略網(wǎng)絡(luò)推薦 “下一手”時的獲勝概率。這兩個算法相輔相成,互相推動,產(chǎn)生了乘法效應(yīng)。

  狗狗的“棋感”一開始是跟人學(xué)的,但的形勢判斷能力是自己發(fā)展起來的。形勢判斷能力其實是下圍棋的核心能力,這恰恰是人類的弱點(diǎn)和容易被忽視的地方。人類棋手在序盤和中盤用的“點(diǎn)目法”做形勢判斷的方法是非常非常粗糙的近似,無法和機(jī)器的量化方法(比如說把勝率到小數(shù)點(diǎn)后3位)抗衡。人腦其實剪枝能力超強(qiáng),如果給予充分時間,高手也基本能把變化都算清楚,但是若是在選擇下出對自己更有利的招法時犯糊涂,你說怎么下贏狗?

  Master能通過“反人類思維”的招數(shù)戰(zhàn)勝人類,是機(jī)器學(xué)習(xí)的一個巨大的進(jìn)步!究其原因,一方面可能是過去一年狗狗在“價值網(wǎng)絡(luò)”取得了大突破,在判斷局勢、把握局勢走向的能力上遠(yuǎn)超人類,就是“控場能力爆表”。另一個方面,兩個高水平狗狗雙手互博,可以不斷嘗試超越人類“直覺”或者“經(jīng)驗”的選點(diǎn),這樣一些需要深度模擬才能推敲出來的好棋(比如人類需要反復(fù)推演30步才能得到的結(jié)論),就會被Master挖掘出來。

  這次Master在布局階段走出了不少以前被人類否定的下法,就是說已經(jīng)擺脫了人類棋譜的思維限制,開始探索未入之境。人類下棋其實有個問題,就是借助于經(jīng)驗的成分遠(yuǎn)遠(yuǎn)大于臨場發(fā)揮的成分。比如說學(xué)習(xí)和記憶定式,多考慮一個四分之一棋盤,但是狗狗是通盤全局考慮的,Master新的棋譜就很明顯,左上角是黑子還是白子,無憂角還是大飛角,左下角選擇的定式可能完全不同。這種“牽一發(fā)而動全身”的戰(zhàn)法給人很多啟發(fā),有棋手說“美的讓人哭”。如果說一開始狗狗通過打人類棋譜學(xué)棋,現(xiàn)在是人類通過向狗老師學(xué)習(xí)來探索圍棋的奧秘了。

  翻譯成機(jī)器學(xué)習(xí)的語言,狗狗是從監(jiān)督學(xué)習(xí)(照棋譜學(xué)習(xí))進(jìn)入了非監(jiān)督學(xué)習(xí)(自由探索)的階段,AlphaGo的設(shè)計者讓程序具備了自我進(jìn)化的能力。人工智能算法的提升依賴于高質(zhì)量的數(shù)據(jù),在任何領(lǐng)域,高質(zhì)量的標(biāo)注數(shù)據(jù)(比如說高手的棋譜)都是有限的,或者說生產(chǎn)速度很慢,成本很高。AlphaGo一旦能夠自我產(chǎn)生高水平的新數(shù)據(jù),還通過自我博弈不斷提高自身水平,就相當(dāng)于有了自我進(jìn)化的能力。所以說領(lǐng)先的AI技術(shù)一旦確立優(yōu)勢,很有可能一騎絕塵,讓后來者難以追趕。

  舉例來說,日本zen是一個有10年發(fā)展歷史的老牌圍棋程序。他們引入alphago的“策略網(wǎng)絡(luò)”技術(shù)后,很快就提高到了職業(yè)水平,但是后面再提升好像有點(diǎn)難。目前世界第二應(yīng)該是騰訊主力部隊開發(fā)的“絕藝”,開發(fā)半年多現(xiàn)在已經(jīng)到了去年AlphaGo戰(zhàn)勝李世石的水平。雖然距離Master還有差距,我非常希望這個國產(chǎn)圍棋程序能迎頭趕上,讓Master不再寂寞。

  在一個商業(yè)領(lǐng)域,如果人工智能技術(shù)能在機(jī)制上能不斷自行產(chǎn)生優(yōu)質(zhì)數(shù)據(jù)從而自我進(jìn)化,那么別人后來居上的可能性也就大大降低,這可能就是全球頂尖互聯(lián)網(wǎng)公司在人工智能領(lǐng)域做瘋狂的軍備競賽的動因。

  好了,Master“粲粲如星,揮灑縛豪英”的故事就說到這里。既然已經(jīng)提到了AI商業(yè)化,下一篇就回到我工作的領(lǐng)域,談?wù)勅斯ぶ悄芎蜕虡I(yè)結(jié)合。

我來說兩句
人參與 丨 評論0條)
圖標(biāo)
注冊 登錄    
評論列表
每頁 10 條,共 0 條

品牌商品

營業(yè)執(zhí)照 | 增值電信業(yè)務(wù)經(jīng)營許可證 | 豫公網(wǎng)安備41130202000490號 | 豫ICP備19015714號-1 (版權(quán)所有 防爆云平臺 © Copyright 2009 - 2024 . All Rights Reserved.)