英國(guó)《自然》雜志27日公開(kāi)的論文,報(bào)道了一種能在傳統(tǒng)策略游戲——圍棋上擊敗專業(yè)選手的電腦程序。圍棋被認(rèn)為是人工智能領(lǐng)域一個(gè)非常具有標(biāo)志性的“大挑戰(zhàn)”,這項(xiàng)成果可能會(huì)給人工智能領(lǐng)域其他看似難以實(shí)現(xiàn)的人類級(jí)別能力的項(xiàng)目帶來(lái)希望。
現(xiàn)在的國(guó)際象棋領(lǐng)域,人類頂尖選手都會(huì)被電腦殺得丟盔棄甲,圍棋則不然。圍棋起源于中國(guó),兩個(gè)選手在矩形格子上交換下黑子和白子,目標(biāo)是在比賽結(jié)束時(shí)比對(duì)方占領(lǐng)更多的地盤。正是源于圍棋巨大的搜索空間,很難估計(jì)局面和下子,讓圍棋被視作人工智能領(lǐng)域“難以搞定”的標(biāo)志性項(xiàng)目。迄今最成功的圍棋計(jì)算機(jī)程序,能達(dá)到業(yè)余人類選手的程度,但還不能和專業(yè)選手在不讓子的情況下一較高下。
此次,位于英國(guó)倫敦的谷歌旗下DeepMind公司的戴維·西爾弗、艾佳·黃和杰米斯·哈薩比斯與他們的團(tuán)隊(duì),開(kāi)發(fā)了一個(gè)叫“AlphaGo”的程序,利用“價(jià)值網(wǎng)絡(luò)”去計(jì)算局面,用“策略網(wǎng)絡(luò)”去選擇下子。訓(xùn)練這些深度神經(jīng)網(wǎng)絡(luò)的,是對(duì)人類專業(yè)棋局的監(jiān)督學(xué)習(xí)以及讓它和自己對(duì)弈的增強(qiáng)學(xué)習(xí)。
“AlphaGo”程序在和其他圍棋程序的對(duì)抗中獲得了99.8%的勝率,并且在一項(xiàng)競(jìng)賽中以5比0的成績(jī)戰(zhàn)勝了歐洲圍棋冠軍。計(jì)算機(jī)程序能在不讓子的情況下,在完整的圍棋游戲中擊敗專業(yè)選手,這還是第一次。原本人們認(rèn)為,要到10年后人工智能才能達(dá)到這一成就。
27日是國(guó)際大屠殺紀(jì)念日。當(dāng)天,波蘭舉行了奧斯威辛集中營(yíng)解放71周年的紀(jì)念活動(dòng),今年的主題是回歸生活。波蘭總統(tǒng)...[詳細(xì)]