強化学習

森村哲郎・著
シリーズ:
機械学習プロフェッショナルシリーズ

強化学習

発行
2019/05/21
サイズ
A5
ページ数
320
ISBN
978-4-06-515591-2
定価
3,300円(税込)
在庫
在庫あり

書籍を購入する

定価
3,300円(税込)

電子書籍

※価格は紙の本と異なります。また、書店によって価格が異なる場合もあります。※配信開始日は各書店により異なります。書店によっては取り扱いのない作品もございます。あらかじめご了承ください。
電子書籍版を見る

内容紹介

強化学習で必要になる数理を、広くカバーした。一貫してていねいな解説なので、じっくり読める。ベルマン方程式の定式化、マルコフ決定過程・方策勾配法をより深く! 最後に、分布強化学習、深層強化学習を紹介した。参考文献・付録も充実!

目次

第1章 準備
1.1 強化学習とは
1.2 マルコフ決定過程と逐次的意思決定問題
1.3 方策
1.4 逐次的意思決定問題の定式化

第2章 プランニング
2.1 準備
2.2 動的計画法
2.3 動的計画法による解法
2.4 線形計画法による解法

第3章 探索と活用のトレードオフ
3.1 概要
3.2 探索と活用のトレードオフ
3.3 方策モデル

第4章 モデルフリー型の強化学習
4.1 データにもとづく意思決定
4.2 価値関数の推定
4.3 方策と行動価値関数の学習
4.4 収束性
4.5 アクター・クリティック法

第5章 モデルベース型の強化学習
5.1 問題設定の整理
5.2 環境推定
5.3 ブラックボックス生成モデルに対するプランニング
5.4 オンラインのモデルベース型強化学習

第6章 関数近似を用いた強化学習
6.1 概要
6.2 価値関数の関数近似
6.3 方策の関数近似

第7章 部分観測マルコフ決定過程
7.1 部分観測マルコフ決定過程(POMDP)の基礎
7.2 POMDP のプランニング
7.3 POMDP の学習

第8章 最近の話題
8.1 分布強化学習
8.2 深層強化学習

付録A 補足
A.1 証明
A.2 ノルム
A.3 線形計画法
A.4 自然勾配法の補足


リンク