據(jù)悉AlphaGo人工智能是由DeepMind開發(fā)的,目的是征服世界上最古老的游戲:圍棋。圍棋是一種非常受歡迎的游戲,而且它比國際象棋更復(fù)雜。還有什么比圍棋更好的游戲來測試這款人工智能呢?
通過從與不同水平的玩家的數(shù)千盤圍棋博弈中學(xué)習(xí),AlphaGo已經(jīng)學(xué)會(huì)了玩這個(gè)游戲。它最終擊敗了圍棋冠軍Lee Sedol,他是一位18個(gè)世界圍棋冠軍獲得者。AlphaGo人工智能的后一個(gè)版本,AlphaGo Zero(AGZ),甚至學(xué)會(huì)了通過玩游戲來不斷挑戰(zhàn)完善自己。AGZ能夠贏得一場對抗AlphaGo的圍棋比賽,所以我們可以說他是世界上最好的圍棋選手。
令人印象深刻的是,AGZ能夠在沒有研究人員的幫助或投入的條件下完全依靠自己的能力達(dá)到專業(yè)棋手水平。該團(tuán)隊(duì)認(rèn)為,通過跳過人類輸入階段可以擁有優(yōu)勢:“人類的知識(shí)可能對于解決一些問題來說太昂貴、太不可靠或根本無法使用。”然而,真正令人震驚的是,AGZ人工智能在發(fā)展自己的技能方面可以走得更遠(yuǎn)。
DeepMind的首席執(zhí)行官兼聯(lián)合創(chuàng)始人Demis Hassabis在谷歌的Go North大會(huì)上說,關(guān)于AGZ,“我們從來沒有真正探索出這個(gè)版本的AlphaGo的能力能到達(dá)多高的一個(gè)高度。我們需要電腦來做別的事情。”
AGZ可以進(jìn)行重新啟動(dòng),這可以幫助人類圍棋玩家學(xué)習(xí)新的落子方式和策略。人工智能也可以被重新指派到解決其他的問題。研究人員說,這些任務(wù)可能包括很多類別,比如:蛋白質(zhì)折疊問題,如何減少能量消耗,或者尋找革命性的新材料。AGZ有潛力創(chuàng)造一個(gè)更美好的社會(huì),而開發(fā)團(tuán)隊(duì)也在進(jìn)一步探索它。
不過,也有業(yè)內(nèi)人士指出,“拋棄人類經(jīng)驗(yàn)”和“自我訓(xùn)練”并非AlphaGo Zero最大的亮點(diǎn),其關(guān)鍵在于采用了新的reinforcement learning(強(qiáng)化學(xué)習(xí)的算法),并給該算法帶了新的發(fā)展。那么,小伙伴們又如何看待此事呢?
留言與評(píng)論(共有 條評(píng)論) |