新聞動(dòng)態(tài)
熱門(mén)文章
-
如何幫助一年級(jí)孩子盡快適應(yīng)學(xué)校生活? 2024-11-18
-
職業(yè)教育研究要重點(diǎn)關(guān)注15個(gè)領(lǐng)域 2024-11-17
阿爾法狗再進(jìn)化 使用強(qiáng)化學(xué)習(xí)技術(shù)
2017-10-22 | 文章來(lái)源:阿爾法狗再進(jìn)化:100:0碾壓舊版 阿爾法狗再進(jìn)化,10月19日谷歌旗下人工智能研究部門(mén)DeepMind發(fā)布了新版AlphaGo(阿爾法狗)軟件,它可以完全靠自己學(xué)習(xí)圍棋 這款名為AlphaGo Zero的系統(tǒng)可以通過(guò)自我對(duì)弈進(jìn)行學(xué)習(xí),它利用了一種名為強(qiáng)化學(xué)習(xí)的技術(shù)。 | 分享到:
阿爾法狗再進(jìn)化:100:0碾壓舊版 阿爾法狗再進(jìn)化,10月19日谷歌旗下人工智能研究部門(mén)DeepMind發(fā)布了新版AlphaGo(阿爾法狗)軟件,它可以完全靠自己學(xué)習(xí)圍棋 這款名為AlphaGo Zero的系統(tǒng)可以通過(guò)自我對(duì)弈進(jìn)行學(xué)習(xí),它利用了一種名為強(qiáng)化學(xué)習(xí)的技術(shù)。
熱點(diǎn)背景
導(dǎo)讀經(jīng)過(guò)3天的訓(xùn)練后,這套系統(tǒng)已經(jīng)可以擊敗AlphaGo Lee,也就是去年擊敗韓國(guó)頂尖棋手李世石的那套系統(tǒng),而且比分高達(dá)100比0。經(jīng)過(guò)40天訓(xùn)練后,它總計(jì)運(yùn)行了大約2900萬(wàn)次自我對(duì)弈,使得AlphaGo Zero得以擊敗AlphaGo Master(今年早些時(shí)候擊敗世界冠軍柯潔的系統(tǒng)),比分為89比11。
【關(guān)注川越微信公眾號(hào),了解更多】