1,800円以上の注文で送料無料

書籍
書籍
1211-03-01

強化学習機械学習プロフェッショナルシリーズ

森村哲郎(著者), 杉山将(編者)

2件

追加するに追加する

中古新品

定価 ¥3,630

1,760円定価より1,870円（51%）おトク

獲得ポイント16P

入荷のお知らせを受け取る

在庫なし

発送時期 1～5日以内に発送

値下げのお知らせを受け取る

商品詳細

内容紹介
販売会社／発売会社	講談社
発売年月日	2019/05/01 改訂版・発行年月日について
JAN	9784065155912

値下げのお知らせメールを受け取る価格を設定してください

円以下

値下げのお知らせ登録を解除します

書籍
書籍

強化学習

商品が入荷した店舗：0店

店頭で購入可能な商品の入荷情報となります

ご来店の際には売り切れの場合もございます

オンラインストア上の価格と店頭価格は異なります

お電話やお問い合わせフォームでの在庫確認、お客様宅への発送やお取り置き・お取り寄せは行っておりません

カートに追加できませんでした

強化学習

¥1,760

在庫なし

入荷のお知らせを受け取る

商品レビュー

2件のお客様レビュー

レビューを投稿

2025/05/27

確立過程として互いに独立で同一の確率分布という強めの仮定の独立同一分布(i.i.d.)。そこから仮定弱めたマルコフ性。状態遷移確率。TD法各種。アクター・クリティック法面白いけど使いこなせる気がしない。モデルフリー/モデルベース型強化学習。名前だけ紹介のあった、報酬観測なしの履歴...

表示する

確立過程として互いに独立で同一の確率分布という強めの仮定の独立同一分布(i.i.d.)。そこから仮定弱めたマルコフ性。状態遷移確率。TD法各種。アクター・クリティック法面白いけど使いこなせる気がしない。モデルフリー/モデルベース型強化学習。名前だけ紹介のあった、報酬観測なしの履歴データから報酬関数や行動方策を推定する逆強化学習、どうやるんだろう。途中から式を追うのがしんどくなり、飛ばし飛ばし…最後の今流行りのDQNのところは少しゆっくり読んでみた。レインボーDQNという欲張り手法。

Posted by ブクログ

2024/04/18

【精密工学科】ベストリーダー2024 第9位東京大学にある本はこちら https://opac.dl.itc.u-tokyo.ac.jp/opac/opac_details/?bibid=2003471880

Posted by ブクログ

すべてのレビューを見る

強化学習 機械学習プロフェッショナルシリーズ

商品詳細

商品レビュー

関連ワードから探す

強化学習機械学習プロフェッショナルシリーズ