とある弁当屋の統計技師 の商品レビュー
- ネタバレ
※このレビューにはネタバレを含みます
統計学の超入門として会社の本棚に入っていたので手に取りました。 内容としては、弁当屋の売上に焦点を当てて統計学を用いてどのように分析をするのかを解説しながら展開をしていきました。 ただ、その形式で進めているからか、小説部分の比重が重くなってしまっているようでした。 統計学について概要を掴むよりこんなシーンで利用想定ができるということを考えたり想像できるのに有効だと思いました。
Posted by
統計の話がデータサイエンティストの物語形式になっていて難しい本とは違い優しく読めた。 専門用語がやはり難しいのだが、内容的には初心者にも理解できると思う。こういう本が増えて欲しい。
Posted by
統計の基本概念、方法論が丁寧に解説してあって、面白く読めた。でもわかりやすく、平易にと考えた分だけ、細かい部分があいまいになった感があって、ちょっともどかしい感じだったかな。忘れかけていた統計を勉強し直してみたくなった。
Posted by
弁当屋を舞台に、統計技師の初歩を学べる本。 普通に読み物として読むのなら、当然ですが ほとんど読めるところはありません。 弁当屋の娘がツンデレだと思えたなら、もう少し 楽しいかも知れません…。 単なる気に入らない事があると暴力に訴えるだけの 嫌な女の子、にしか見えませんが。 ...
弁当屋を舞台に、統計技師の初歩を学べる本。 普通に読み物として読むのなら、当然ですが ほとんど読めるところはありません。 弁当屋の娘がツンデレだと思えたなら、もう少し 楽しいかも知れません…。 単なる気に入らない事があると暴力に訴えるだけの 嫌な女の子、にしか見えませんが。 どういう風にしてデーターを取っていくのか。 それをどう生かしていくのか。 分かりやすかったとは思いますが、使わない人にとって 読んだ後、知識として残っているかは、謎です。
Posted by
http://public-errata.appspot.com/errata/book/9784320110489/
Posted by
標本平均の平均値、標本平均の標準偏差。 中心極限定理 帰無仮説と対立仮説を建てる。帰無仮説を前提とした場合のt値から確率を求める。0.05未満であれば帰無仮説を棄却する。対立仮説が採択される。 ダミー変数(0か1か)。 自由度=データ数からパラメータを引いた数。 決定木。 ...
標本平均の平均値、標本平均の標準偏差。 中心極限定理 帰無仮説と対立仮説を建てる。帰無仮説を前提とした場合のt値から確率を求める。0.05未満であれば帰無仮説を棄却する。対立仮説が採択される。 ダミー変数(0か1か)。 自由度=データ数からパラメータを引いた数。 決定木。 対数は、右肩の乗数を求めること。
Posted by
弁当の売上分析、売上予測をテーマに書かれた統計本。 銀座のデータサイエンティストというブログでも紹介されています。 物語ベースでの説明になっているため、初心者でも分かりやすく書かれていた。 仮説検定についても分かりやすく書いていたので、 少し理解が深まったように感じた。 【参考...
弁当の売上分析、売上予測をテーマに書かれた統計本。 銀座のデータサイエンティストというブログでも紹介されています。 物語ベースでの説明になっているため、初心者でも分かりやすく書かれていた。 仮説検定についても分かりやすく書いていたので、 少し理解が深まったように感じた。 【参考になったこと】 ・データ分析でみるべきは、平均からのバラツキ。 ・帰無仮説とは「係数を0と考えること」で、 係数が0でないことを対立仮説と呼ぶ。 帰無仮説の基で統計量(t値)が計算される確率を求め、 その確率が0.05より小さい場合は、帰無仮説を棄却し、 対立仮説を採択する。 つまり、今回の係数はまずまず信頼出来るという意味。 ・回帰分析のときは、予測値と実測値のあてはめの良し悪しを 見る必要があり、このときに使うのが「決定係数」 1に近ければあてはめが良い。 ・重回帰分析では、説明変数が多くなるとあてはめそのものは 無条件に改善されてしまうリスクがある。 これをチェックするために、自由度調整済み決定係数を使う。 ・自由度とはデータ数からパラメータ数を引いた値。 これだけのデータが揃えば残りが特定されてしまうという意味。 ・説明変数間は相関が無いデータを選ぶべき。 例えば、天気と気温は選んではいけない。 多重共線性という問題が起きてしまう。 ・カイ二乗検定では、クロス集計表の行列に相関がないかを チェックする。ロジスティック回帰で行う検定。 ・箱ひげ図の上下線が四分位範囲の1.5倍と定義したのは、 正規分布の特徴からである。これで99%近くを網羅するので、 それより外れたデータは外れ値としての検証が必要。 ・母集団全体でバラツキを調査する場合は、 データ量で割ってもデータ量-1で割っても変わらないが、 一般的に標本集団でのバラツキを調査することが多く、 標本集団のバラツキは母集団よりも小さくなる傾向にある。 それを補正するために、データ量-1で割る。 これを不偏分散という。 ・カイ自乗検定において、クロス集計表に5より小さいデータが含まれるとき、 検定の結果が不正確となることがある。 この場合は、フィッシャーの正確確率等を検討すること。
Posted by
ラノベ小説仕立ての統計入門書。 内容は「平均」「分散」「相関」「重回帰分析」「カイ二乗検定」など。 表紙に反し、”統計入門書”として一通り詳しく説明されており、その解説もかなりわかりやすかったように思います。 巻末の「あとがき」で筆者が〈小説は素人〉と告白されています。たし...
ラノベ小説仕立ての統計入門書。 内容は「平均」「分散」「相関」「重回帰分析」「カイ二乗検定」など。 表紙に反し、”統計入門書”として一通り詳しく説明されており、その解説もかなりわかりやすかったように思います。 巻末の「あとがき」で筆者が〈小説は素人〉と告白されています。たしかに物語としてはテンプレ的ですが、純粋に統計入門書として優秀だと思います。 小説の端々に「R(統計ソフト)」が登場しますが、それについての解説はほぼ皆無です。
Posted by
表紙は・・・ですが、意外と内容はきちんとしています 昔、統計を少し勉強している方に有意義だと思います(復習という意味で、、、) 統計初心者のかたは、少しハードルがあるかもしれません
Posted by
データ分析の入口にとkindleで購入したが、改めて表紙を見ると、ポチッたことを後悔した。内容はレベルに合っており、問題なし。小説仕立てで、心おれずに読了できる。続編はの表紙がさらにアレなので、購入を悩んでしまう。
Posted by
- 1
- 2