- 中古
- 書籍
- 書籍
- 1211-03-01
強化学習 機械学習プロフェッショナルシリーズ
定価 ¥3,630
1,760円 定価より1,870円(51%)おトク
獲得ポイント16P
残り1点 ご注文はお早めに
発送時期 1~5日以内に発送
商品詳細
| 内容紹介 | |
|---|---|
| 販売会社/発売会社 | 講談社 |
| 発売年月日 | 2019/05/01 |
| JAN | 9784065155912 |
- 書籍
- 書籍
強化学習
商品が入荷した店舗:0店
店頭で購入可能な商品の入荷情報となります
ご来店の際には売り切れの場合もございます
オンラインストア上の価格と店頭価格は異なります
お電話やお問い合わせフォームでの在庫確認、お客様宅への発送やお取り置き・お取り寄せは行っておりません
強化学習
¥1,760
残り1点
ご注文はお早めに
商品レビュー
4
2件のお客様レビュー
確立過程として互いに独立で同一の確率分布という強めの仮定の独立同一分布(i.i.d.)。そこから仮定弱めたマルコフ性。状態遷移確率。TD法各種。アクター・クリティック法面白いけど使いこなせる気がしない。モデルフリー/モデルベース型強化学習。名前だけ紹介のあった、報酬観測なしの履歴...
確立過程として互いに独立で同一の確率分布という強めの仮定の独立同一分布(i.i.d.)。そこから仮定弱めたマルコフ性。状態遷移確率。TD法各種。アクター・クリティック法面白いけど使いこなせる気がしない。モデルフリー/モデルベース型強化学習。名前だけ紹介のあった、報酬観測なしの履歴データから報酬関数や行動方策を推定する逆強化学習、どうやるんだろう。途中から式を追うのがしんどくなり、飛ばし飛ばし…最後の今流行りのDQNのところは少しゆっくり読んでみた。レインボーDQNという欲張り手法。
Posted by 
【精密工学科】ベストリーダー2024 第9位 東京大学にある本はこちら https://opac.dl.itc.u-tokyo.ac.jp/opac/opac_details/?bibid=2003471880
Posted by 
