訓練 AI 模型玩遊戲 -- 坦克大戰

生成式AI
深度學習
強化式學習
人工智慧實務專題

王O愷

本專題為利用生成式，使用強化式學習與深度學習，嘗試建立一個遊玩系統，一開始以貪吃蛇為主，學習Ｑ-learning，後在貪吃蛇採用DQN，一直到最後的坦克大戰採用PPO等技術。本次專題展出為五子棋訓練過程，以圖表化的方式呈現訓練的失敗率變化，最後也開放實體demo試用，實現人機共玩的目標，最主要是為了能訓練ＡＩ模型玩遊戲。

數位聯展

訓練 AI 模型玩遊戲 -- 坦克大戰

王O愷