1,800円以上の注文で送料無料

データ分析に必須の知識・考え方 統計学入門 の商品レビュー

4.4

5件のお客様レビュー

  1. 5つ

    3

  2. 4つ

    1

  3. 3つ

    1

  4. 2つ

    0

  5. 1つ

    0

レビューを投稿

2023/12/25

 統計学の広範囲の見通しを得たく手に取りました。本書は最近ソシムが出している読みやすさ・見やすさと網羅性を確保したデータサイエンスの概説書シリーズの一冊であり、本書は統計学の多くのトピックを手際よくまとめた便利な本です。  本書は記述統計から推測統計の範囲に至るまで、仮設検定のよ...

 統計学の広範囲の見通しを得たく手に取りました。本書は最近ソシムが出している読みやすさ・見やすさと網羅性を確保したデータサイエンスの概説書シリーズの一冊であり、本書は統計学の多くのトピックを手際よくまとめた便利な本です。  本書は記述統計から推測統計の範囲に至るまで、仮設検定のような複雑なトピックも含めて広い範囲を異常にわかりやすく説明したうえ、統計モデリングやベイズ統計や機械学習に至るまで広範な内容を説明しています。詳細をうまく省いて、何を仮定して何が結論できるかがいつも明快に示されていて、もう少し理論的な本を読むときにはわかりにくい話の流れが掴みやすい内容です。図版に関しても、説明したい内容に関して、目立たせたい部分や違いを強調したい内容g 統計学の広範囲の見通しを得たく手に取りました。本書は最近ソシムが出している読みやすさ・見やすさと網羅性を確保したデータサイエンスの概説書シリーズの一冊であり、本書は統計学の多くのトピックを手際よくまとめた便利な本です。  本書は記述統計から推測統計の範囲に至るまで、仮設検定のような複雑なトピックも含めて広い範囲を異常にわかりやすく説明したうえ、統計モデリングやベイズ統計や機械学習に至るまで広範な内容を説明しています。詳細をうまく省いて、何を仮定して何が結論できるかがいつも明快に示されていて、もう少し理論的な本を読むときにはわかりにくい話の流れが掴みやすい内容です。図版に関しても、説明したい内容に関して、目立たせたい部分や違いを強調したい内容が一目でわかるようになっていて筆者や編集者の丁寧な気配りを感じます。特に仮設検定に関しては丁寧で誤解を生みにくい説明が手を変え品を変え繰り返し与えられ、仮設検定で示せることやp値の定義などがじっくり見につくようになっています。  ただ本書にはちょっと読みにくい部分もあります。本書の図は理解のための骨格を強調して非常に見やすいものでありますが、ちょっと図の中に文章を入れすぎかなとは思います。その点がダメとは思いませんが違和感はあります。あと前書きに「数学的な説明をできるだけ減らし」とあるわりには結構数式で説明しているかなとも感じ、若干コンセプトとズレているような気もします(統計学の本なので当たり前ではあるのですが)。

Posted byブクログ

2023/11/01

返却期限が来て途中まで 高校生が習うような統計の基礎から、各検定法のメリット、デメリットについてまとめられている

Posted byブクログ

2023/05/31
  • ネタバレ

※このレビューにはネタバレを含みます

まあまあ面白かった.わかりやすかったし. 絵で解説されてて読みやすい. 主に論文読むときとかシミュしたあとの分析とかで役に立つと思って読んだが, 普通に読み物としても興味深い内容があっていいね 教官のおすすめであったがまあサクッと読めた 現実に反映できるかは俺次第であるが,提示されたグラフや結論を鵜呑みにすべきではないってのはよくわかったわ 内容は, ヒストグラムによる分布の可視化とビン幅の注意点, 統計量(標準偏差とか)の使い方・特徴, 得られた実現値からある確率分布の母集団を推定するという目標, 母集団と標本の誤差の扱い方, 信頼区間の考え方, t分布ってサンプル数少ないときにも出せる正規分布みたいなやつ, 仮説検定(仮説を立てて検証,帰無仮説,対立仮説), 2つのデータ群に「統計的に優位な差が見られた」とする観測値の平均の差とかに外れ値が出る確率であるp値の定義, 立てた仮説で本当は差がないのに優位な差があると判断してしまうリスク(過誤)について, 検定の種類(正規性があるときは平均とか標準偏差のパラメトリック検定,外れ値とか非対称な分布はノンパラメトリック検定とか), ANOVA(母集団3群以上の平均値の比較としての分散分析っての,群同士のペアで比較してすべてのペアの平均が同じか確認.少なくとも一つが違うかが出る), 多重比較検定(ANOVAとはちがって,どの群が違うのかがわかる) 2つの変数の相関と回帰(相関の有無と因果関係は別), 相関係数は正規性のあるデータじゃないと使うの危険なこと, 重回帰(説明変数が2こ以上あるもの,体重についての運動量と身長とか) 共分散分析(2変数の) ロジスティック回帰(Yes,Noの確率を表すときの推移の関数として使える) オッズ比(起こる確率/起こらない確率 のやつ 普通の確率何%とは扱いが違う) 再現性の危機 仮設検定で統計的に優位となるp値をいじれてしまう話 p-hacking p値いじれること 最近はネガティブデータも掲載するようにされてきてるし,研究者側もp値よくなるまでサンプル数増やしたりしないようにしたり,尤もらしい良い仮説を立てるように努めるべき 因果と相関 観察データと実験データによる根拠の分析 実験データはそのほかの要因,交絡因子の影響を除くことができる 統計的因果推論 重回帰とかを使って観察データから推測する奴 ベイズ統計 確率に不確実性を考慮する 次元を減らす(変数を減らす)ための主成分分析、共通因子 統計分析に関わる機械学習の。 教師なし学習はクラスター分析と次元削減 教師あり学習は2変数の間の関数を求める モデル化。確率によるモデルと数理によるモデル 決定論的モデル(微分方程式、差分方程式、偏微分方程式など)ある時刻の状態が決まったら次の状態が一意に決まる 確率的モデル(ランダムウォーク、マルコフ過程など) 非線形の基本的な考え方は変数の値に依存して増え方のルールが代わるって考えると線形非線形わかりやすいな 過去に依らず、現在によって未来が決まる性質をマルコフ性という

Posted byブクログ

2023/07/08

数値数式が、ちゃんと都度都度グラフ(座標)で説明されるのでとてもわかりやすい。科学分野の人たちが何をベースに物事を考えてるか、知識が更新された。 自分自身の理解度は検定のとこと後半(因果推論関連は読んできた)までで、回帰分析らへんはまたおいおい見ていきたいけど、p値の問題も把握...

数値数式が、ちゃんと都度都度グラフ(座標)で説明されるのでとてもわかりやすい。科学分野の人たちが何をベースに物事を考えてるか、知識が更新された。 自分自身の理解度は検定のとこと後半(因果推論関連は読んできた)までで、回帰分析らへんはまたおいおい見ていきたいけど、p値の問題も把握できてよかった。 数理モデルって何?て思ってたけど、CGがやってきたことだな? 統計学、知れば知るほど、世界の母集団は複雑だねえ。この方法で取り出せる真実はホントほんの一部だねえと思う。

Posted byブクログ

2022/01/09

全体像 を知らないままで聞き齧りであーだこーだ の人が多い迷走 全体像 を本書で読むと見通しが良くなる

Posted byブクログ