エンジニアの棚橋です.
RCOが毎週社内で行っている論文輪読会にて、今週はDeep Q-Networkについて書かれた論文を読みました.
Deep Q-Network(DQN)は2013年にDeepMind Technologies社(現Google DeepMind)が発表した強化学習の手法です.
既存の近似関数を用いたQ学習と呼ばれる強化学習の手法では,一つ一つのゲームに対して状態の特徴量を手作りする必要がありました.しかし,DQNは画像情報を入力として特徴を自動的に抽出することであらゆるゲームに対して特別なパラメータの設定をすることなく高いスコアを出すことに成功したモデルです.
DQN応用先としては,入力データが高次元で状態の特徴をうまく作りにくい場面が向いており,ロボットのコントロールなどにも応用されています(YouTube: Deep Learning for Decision Making and Control)
Mnih, Volodymyr, et al. “Human-level control through deep reinforcement learning.” Nature 518.7540 (2015): 529-533.