データサイエンス入門 の商品レビュー
“入門”というよりも“ダイジェスト”と言う方が感覚的に近い。統計パートでは数式や専門用語が結構出てくるので、初学者にはそれがハードルになる。「データサイエンスをちゃんと勉強するためにはこれくらいの数学の知識が必要ですよ」という著者のメッセージだろう。データサイエンスを勉強しようと...
“入門”というよりも“ダイジェスト”と言う方が感覚的に近い。統計パートでは数式や専門用語が結構出てくるので、初学者にはそれがハードルになる。「データサイエンスをちゃんと勉強するためにはこれくらいの数学の知識が必要ですよ」という著者のメッセージだろう。データサイエンスを勉強しようと思って本書を読み進めたものの、途中で諦めて読むのを止めてしまう人も結構いるのではないかと思う。 ただ、ビッグデータを分析する際の主成分分析の重要性を強調したくだりは参考になった。確かに、全て独立変数に入れてしまうと回帰モデルの当てはまりが悪くなるだろうし、多重共線性も出てしまう。また分散分析をやってたとえ主効果が有意であっても、多重比較が大変になる(SPSSを使えば一発だが)。 もちろん、主成分分析が上手くいけばの話だが。
Posted by
データ分析の一連の流れについて、網羅的にまとめられている。少し難解な表現も含まれるため、初学者よりかは、ある程度学習が進んだ人における体系整理に有用かと思う。
Posted by
- 1
