AD-TECH
Lab BLOG
RCO アドテクLab ブログ

"Human-level control through deep reinforcement learning"を社内論文輪読会で読みました

2016/02/23k_tanahashi

このエントリーをはてなブックマークに追加

エンジニアの棚橋です.

RCOが毎週社内で行っている論文輪読会にて、今週はDeep Q-Networkについて書かれた論文を読みました.

Deep Q-Network(DQN)は2013年にDeepMind Technologies社(現Google DeepMind)が発表した強化学習の手法です.

既存の近似関数を用いたQ学習と呼ばれる強化学習の手法では,一つ一つのゲームに対して状態の特徴量を手作りする必要がありました.しかし,DQNは画像情報を入力として特徴を自動的に抽出することであらゆるゲームに対して特別なパラメータの設定をすることなく高いスコアを出すことに成功したモデルです.

DQN応用先としては,入力データが高次元で状態の特徴をうまく作りにくい場面が向いており,ロボットのコントロールなどにも応用されています(YouTube: Deep Learning for Decision Making and Control)

Deep Q-Network 論文輪読会 from Kotaro Tanahashi

Mnih, Volodymyr, et al. “Human-level control through deep reinforcement learning.” Nature 518.7540 (2015): 529-533.

TAGS :

#自己啓発