Python機械学習プログラミング の商品レビュー
pythonでの機械学習コーディングの考え方を学ぶべく読書。実務で活用するにあたり、どんなハードルが発生しうるのか認識しておこうとおもい。
Posted by
もう第三版が出るし、類書も増えたので価値はやや下ったのかもしれないが、Pythonで機械学習をやる上で必要なことを幅広く盛り込んでいる。コード例も豊富。 本書は不要だが、後継の第三版は推奨したい。
Posted by
いろいろなアプローチが掲載されており、事あるごとに振り返ると良さそうな良書です。原理面の説明もなるべく平易にしてくれようとしており、比較的理解しやすかったと思います。
Posted by
これ1冊マスターすればそれなりに戦えるPython技術者になれます(きっと)。機械学習の基礎(パーセプトロンとか)とPythonの基本文法を覚えた後に読むのがよさそうです。 続きはこちら↓ https://flying-bookjunkie.blogspot.com/2018/1...
これ1冊マスターすればそれなりに戦えるPython技術者になれます(きっと)。機械学習の基礎(パーセプトロンとか)とPythonの基本文法を覚えた後に読むのがよさそうです。 続きはこちら↓ https://flying-bookjunkie.blogspot.com/2018/12/python.html Amazon↓ https://amzn.to/2QNtGTA
Posted by
第1章 「データから学習する能力」をコンピュータに与える 機械学習の全般的な説明、教師あり学習の分類・教師あり学習の回帰・教師なし学習・クラスタリング・ニューラルネットワークについて説明がある。 強化学習についての説明はない。 第2章 分類問題 irisデータセットで分類問...
第1章 「データから学習する能力」をコンピュータに与える 機械学習の全般的な説明、教師あり学習の分類・教師あり学習の回帰・教師なし学習・クラスタリング・ニューラルネットワークについて説明がある。 強化学習についての説明はない。 第2章 分類問題 irisデータセットで分類問題を解いていく。 パーセプトロンモデルの活性化関数は単位ステップ関数(ヘビサイド関数)、学習規則は教師データと出力値との誤差を重みに更新する。 目的関数に誤差平方和を使用し、勾配降下法で解を求める方法が実装されている 第3章 分類問題 scikit-learnの活用 scikit-learnでのdatasetsの紹介 パーセプトロンをscikit-learnで実装している。データの標準化の手法も説明している。 ロジスティック回帰による分類問題の解、今までの分類は分類できた、できなかったの出力であったがどの程度分類できたか確率で表現できるのが新しい。 線形分離可能問題にしか適用できないのは今までと同じ。 サポートベクトルマシンによる分類 非線形分類問題にも対応可能な手法(カーネルトリック) 決定木学習 フローチャートを自動的に作ってくれる学習方法? 複数の決定木を組み合せたランダムフォレストは過学習に強い。 k近傍法(KNN)教師なし学習のk-meansに似ている。 第4章 データ前処理 pandasをつかった欠損値対応が紹介されている。 カテゴリーデータをscikit-learn内で使用するため返還する方法としてmap関数の使用、scikit-learn内のLabelEncoderクラスの使用を推奨している。 名義特徴量のone-hotエンコーダ 訓練データ、テストデータの分割に使用するtrain_test_split関数の紹介 スケーリングの方法として標準化と正規化の特徴 過学習への対応としてL1,L2正規化の解説 第5章 次元削減でデータを圧縮する 主成分分析による次元削減、線形判別分析による次元削減 第6章 モデルの評価とハイパーパラメータのチューニングのベストプラクティス モデルによって分類問題を解いていくがどのモデルが良いのか評価する手法を解説する ホールドアウト法:一番簡単で基本 k分割交差検証:データセットをk個に分割して与える 学習曲線(訓練データを使用したときの精度)と検証曲線(テストデータを使用したときの精度) グリッドサーチによるもっともいハイパーパラメータ決め方 第7章 アンサンブル学習 複数の学習器(分類器)を組み合わせて最も良い結果を出すランダムフォレストに考え方が似ている。 第8章 機械学習の適用 感情分析 映画レビューをで学習して文書からネガテブな文書なのかポジテブな文書なのかを分類を学習する 第9章 機械学習の適用2 Webアプリケーション 前の映画レビュー分類器をWebアプリとして実装する 第10章 回帰分析 線形回帰 ロバスト回帰 多項式回帰 ランダムフォレスト回帰 第11章 クラスタ分析 k-means法 階層木 第12章 ニューラルネットワーク 手書きの数字を分類(MNISTデータセット) 畳み込みニューラルネットワーク(CNN) リカレントニューラルネットワーク(RNN) 第13章 ニューラルネットワーク Theanoライブラリによりトレーニング Kerasを使ったトレーニングの実装
Posted by
- 1