數位聯展

訓練 AI 模型玩遊戲 -- 坦克大戰

王O愷

本專題為利用生成式,使用強化式學習與深度學習,嘗試建立一個遊玩系統,一開始以貪吃蛇為主,學習Q-learning,後在貪吃蛇採用DQN,一直到最後的坦克大戰採用PPO等技術。本次專題展出為五子棋訓練過程,以圖表化的方式呈現訓練的失敗率變化,最後也開放實體demo試用,實現人機共玩的目標,最主要是為了能訓練AI模型玩遊戲。