揭秘:大戰柯潔的AlphaGo究竟如何決定落子?
5月23日,中國著名棋手柯潔九段在與谷歌人工智能系統AlphaGo的“人機大戰”中,先失一局。?“AlphaGo”到底是什麼?究竟如何落子?解放日報·上觀新聞記者得到瞭此次大賽的官方解釋。
?
?
AlphaGo已經是職業九段
?
一言以蔽之,AlphaGo是第一個擊敗人類職業圍棋選手並戰勝圍棋世界冠軍的程序。2016年3月,在全世界超過一億觀眾的關註下,AlphaGo經過5局對弈,最終以4:1的總比分戰勝瞭韓國棋手、圍棋世界冠軍李世石,這場比賽成為人工智能領域的一個重要裡程碑,因為過去曾有專傢預測人工智能需要十年的時間才有可能戰勝人類職業選手。在這次比賽之後,AlphaGo憑借其“充滿創意而又機智”的下法,躋身圍棋界最高職業稱號——職業九段行列,成為歷史上首個獲得這一榮譽的非人類棋手。
?台中水肥清運
近期,AlphaGo的升級版本以“Master/Magister”的稱謂與世界頂級的圍棋選手進行瞭60場線上台中清化糞池推薦快棋對局,取得瞭全勝。
?
如何進行訓練?
?
一直以來,圍棋就被認為是傳統遊戲中對人工智能最具挑戰性的項目。這不僅僅是因為圍棋包含瞭龐大的搜索空間,更是因為對於落子位置的評估難度已遠遠超過瞭簡單的啟發式算法。
?
為瞭應對圍棋的巨大復雜性,AlphaGo采用瞭一種新穎的機器學習技術,結合瞭監督學習和強化學習的優勢。通過訓練形成一個策略網絡(policy network),將棋盤上的局勢作為輸入信息,並對所有可行的落子位置生成一個概率分佈。然後,訓練出一個價值網絡(value network)對自我進行預測,以-1(對手的絕對勝利)到1(AlphaGo的絕對勝利)的標準,預測所有可行落子位置的結果。
?
這兩個網絡自身都十分強大,而AlphaGo將這兩種網絡整合進基於概率的蒙特卡羅樹(MCTS)中,實現瞭它的真正優勢。
?
最後,新版的AlphaGo產生大量自我對弈棋局,為下一代版本提供瞭訓練數據,此過程循環往復。
?
如何決定落子?
?
在獲得棋局信息後,AlphaGo會根據策略網絡探索哪個位置同時具備高潛在價值和高可能性,進而決定最佳落子位置。在分配的搜索時間結束時,模擬過程中被系統最頻繁考察的位置將成為AlphaGo的最終選擇。
在經過先期的全盤探索和過程中,以及對最佳落子的不斷揣摩後,AlphaGo的搜索算法就能在其計算能力之上加入近似人類的直覺判斷。
?
?
棋風怎麼樣?
台中包通馬桶?
在業內人士看來,AlphaGo最強大的地方,並不體現在具體某一手棋或者某個局部變化中,而是它在每一局棋裡所展示出來的獨特視角。所以,AlphaGo的棋風本身並不容易總結。
?
但是,總體來說,AlphaGo更傾向於使用一種自由、開放式的行棋風格。在它的世界裡,沒有什麼先入為主的概念,也沒有什麼必須要遵守的規則,這讓它得以打破常規,發現當前棋局中最高效的一手。在接下來的兩局棋裡,AlphaGo這種獨特的對局哲學,常常讓它下出違反第一感、但極具威力的一手棋。
?
雖然圍棋是圍地盤遊戲,但事實上最具決定性的部分在於如何平衡棋盤上的各個局部。在這個點上,AlphaGo展現出瞭卓越的能力。尤其值得一提的是,AlphaGo對於外勢的把控可以說到達瞭出神入化的地步。具體來說,它可以近乎準確地判斷棋盤上現有棋子能給周圍區域帶來多大的影響力。雖說棋子的影響力本身很難衡量,但是AlphaGo的價值網絡讓它能夠把棋盤上所有的棋子當作一個整體來考慮,因此它的判斷幾近精確。AlphaGo的這種能力,使得它能夠把局部棋子的影響力,轉變為全局的優勢。
欄目主編:任翀 ?文中圖片:作者提供 ?題圖編輯:邵競? 欄目郵箱:sh_chuangke@163.com
- 台中清化糞池 台中抽水肥價格大約多少呢?台中抽水肥價格網路匯整~
- 各軍營單位抽肥 台中市化糞池清理店家~化糞池清理好評找台中抽水肥專業網就對了
- 台中通馬桶價格 台中抽水肥價格大約多少呢?台中抽水肥價格網路匯整~
AUGI SPORTS|重機車靴|重機車靴推薦|重機專用車靴|重機防摔鞋|重機防摔鞋推薦|重機防摔鞋
AUGI SPORTS|augisports|racing boots|urban boots|motorcycle boots