統計学が最強の学問である の商品レビュー
統計学の有効性、誤解がよくわかったけど、中盤からはついていけない。高校数学から勉強し直しが必要だと思いました。
Posted by
- ネタバレ
※このレビューにはネタバレを含みます
■概要 政府やマスコミが大衆を操作しようとして発表する数値や、身近な詐欺的行為に騙されないようにするためには、統計リテラシーが最も重要である、という主張で、大学教授が統計学の体系・歴史的背景等について書いた本。 ■感想 統計学とは、ビッグデータを高性能コンピュータで総当り的に高速計算させて答えを導き出すことをいうのではない。膨大なデータをいかに効率よくサンプリングして(手抜きして)情報を分析して誤差を最小限まで小さくし、投資対効果のメリットのある対策を見つけ出す技術のことだということが、良く分かった。例えば、マーケティング調査では、調査対象が1万人の場合誤差が0.9%、2万人の場合は0.6%だったとして、0.3%の精度を上げるためにコストをかけて調査対象を増やすべきかどうか、といった議論が事前に出来るようになる。 こういった知識は、もしかしたら自分の仕事(システムエンジニア)でも使えるんじゃないかという気がするので、勉強したいと思っていた。とはいえ、この本だけでは、回帰分析・カイ二乗検定など、言葉と用途は出てくるが、詳細な内容説明は無いので、読んだらすぐに実用できるわけではない。次は、実際の数式で勉強する本を読み、またこの本のポイントを読み返すことで、実用知識として身に付けたい。 統計学だけでは簡単に答えの出ないこともある例として、暴力的ゲームと少年犯罪の因果関係というのがあげられて興味深かった。普通の子が暴力的ゲームに影響されて犯罪を犯すのか、もともと暴力的な性格の子が暴力的ゲームを好むのか、どちらが先なのか調べようがない。また、アンケート対象の親が、子供のやっているゲームを暴力的と感じるかどうか人それぞれであるし、もしかしたら、ゲームに対する理解が無く「そんな暴力的なゲームばっかりしちゃダメ!」とか言う怒りっぽい親の子が、遺伝的に犯罪しやすいのかもしれない。たしかに、考え出したら答えは一つじゃないかも。
Posted by
「全力を尽くす」と「最善を尽くす」、どちらが正しいだろうか? もし、先人の試行錯誤の結果をもとに、考えられる「最善」があるなら、それを利用しないで「頑張った」というのは偽善ではないだろうか? 世の中には統計学によって、今考えられる「最善」の手があり、ちゃんと調べればそれを知る...
「全力を尽くす」と「最善を尽くす」、どちらが正しいだろうか? もし、先人の試行錯誤の結果をもとに、考えられる「最善」があるなら、それを利用しないで「頑張った」というのは偽善ではないだろうか? 世の中には統計学によって、今考えられる「最善」の手があり、ちゃんと調べればそれを知ることもできる。 にもかかわらず、経験者の勘、専門家の意見を鵜呑みにして、自分で調べることを怠るのは、人として責任を果たしていない。多くの人に影響を与える大切な決断をするのであれば、「最善」を尽くすべきである。 そのような筆者の想いが随所に込められており、あとがきを読んでその背景もはっきり分かった。 ただ、この本を読んでも、統計学が理解できるわけではないし、統計的思考が身につくわけでもない。「これだけ分かっておけばよい」と、概略を説明してくれているものの、勉強した人にとっては良いまとめかもしれないが、基本知識がない私には飲み屋の会話にも使えない。 統計学の必要性については良く伝わった。後は巻末の参考図書を各自勉強しなさい、ということだろう。
Posted by
非常に面白かった! 中盤の統計学の内容は誰にでも簡単に理解できるものではなかったが、序盤と最終章は統計学や統計の使い方を熱く語っており、熱が伝わってきた。 個人的には、特に数学の先生に読んでほしいかもしれない。 中学生を教えていた頃、よく「数学が最も役に立たない教科だ」という話...
非常に面白かった! 中盤の統計学の内容は誰にでも簡単に理解できるものではなかったが、序盤と最終章は統計学や統計の使い方を熱く語っており、熱が伝わってきた。 個人的には、特に数学の先生に読んでほしいかもしれない。 中学生を教えていた頃、よく「数学が最も役に立たない教科だ」という話が平然と聞かれたので、この内容を噛み砕いて語れる数学教員がいたら強いと思う。 特に興味深かったのは、科学哲学の大転換を促したというフィッシャーの「ランダム化」。 これによって社会科学を数理的に科学する方法が整備されたという意味で、経済学にとっても大きな革命だったのだろうと思う。 どちらかというと社会学へのインパクトの方が強そうだったけどねえ。 しかし著者のカバーする領域の広さには恐れ入った。
Posted by
昨日衝動的に買った本です。 どうやら話題の本らしいです。 先日読んだダイヤモンドの記事で統計学を特集していたので、 少しは読んでみるかなぁと思ったのが手に取ったきっかけです。 読み終わっての感想ですが、とにかく前半はワクワクしながら読めます。 しかしテクニカルタームラッシュの中...
昨日衝動的に買った本です。 どうやら話題の本らしいです。 先日読んだダイヤモンドの記事で統計学を特集していたので、 少しは読んでみるかなぁと思ったのが手に取ったきっかけです。 読み終わっての感想ですが、とにかく前半はワクワクしながら読めます。 しかしテクニカルタームラッシュの中盤から後半は ちょっとついていくのが大変でした。 というか半分くらいわかったようなわからんような。 まぁでも非常に統計リテラシーを上げてくれた本でした。 今後、色々なデータを見る際の考え方が 1ステージアップすることは間違いないと思えます。
Posted by
とても刺激的でわかりやすくて勉強になった良著でした。 ビジネスにおいて重要な「データに基いて考える」ためには統計リテラシーが必要である。 おそらくビジネスの世界には絶対的な真理というものはなくて、演繹法的な考え方だけではすべてを説明できない。だからこそ統計学を使って帰納法的に...
とても刺激的でわかりやすくて勉強になった良著でした。 ビジネスにおいて重要な「データに基いて考える」ためには統計リテラシーが必要である。 おそらくビジネスの世界には絶対的な真理というものはなくて、演繹法的な考え方だけではすべてを説明できない。だからこそ統計学を使って帰納法的に説明することが重要なんだと思う。 今注目されているビッグデータは確かに素晴らしい技術革新の賜物で、それで得られるものは大きい。 だが実際、それほどすべての人にとってビッグデータ分析というのは必要にはならない。 一定のサンプル数を超えると、それ以上集めても標準誤差はあまり変わらなくなる。つまりスモールデータ(サンプル)を統計的に分析するだけで、ビッグデータ(全数)を分析するのと大きく変わらない結果が得られることは十分あるという。 大金を投じてまで、その小さな誤差を埋める必要があなたの会社にあるのか?ということ。 —— p37 データをビッグなまま解析することが、どれだけの価値を生むのかどうか、果たして投資するコストに見合うだけのベネフィットが得られるのか p47 適切なサンプリングさえすれば、必要な情報を得るためのコストが激減する にも関わらず、ビッグデータに関心のあるビジネスマンは、しばしばビッグデータをビッグなままで扱うことにしか目が行かないのだ p51 (標準誤差とは)サンプルから得られた割合に対して標準誤差の2倍を引いた値から標準誤差の2倍を足した値までの範囲に真の値が含まれる信頼性が約95%、という値である。 p54 「まず正しい判断に必要な最小十分のデータを扱うこと」 p59 データをビジネスに使うための「3つの問い」 【問1 】何かの要因が変化すれば利益は向上するのか? 【問2】 そうした変化を起こすような行動は実際に可能なのか? 【問3】 変化を起こす行動が可能だとしてそのコストは利益を上回るのか? p83 「意味のある偏り」なのか誤差なのかを確かめる解析手法に「カイ二乗検定」というものがある。 p84 誤差や偶然によってたまたまデータのような差が生じる確率のことをp値という。 このp値が小さければ(慣例的には5%以下)、それに基いて科学者たちは「この結果は偶然得られたとは考えにくい」と判断する p100 ランダム化 p115 ランダムにすることで推定結果の誤差が制御できる p116 ランダム化してしまえば、比較したい両グループの諸条件が平均的にはほぼ揃う p154 データ間の関係性を記述する、あるいは一方のデータから他方のデータを予測する数式を推定するのが回帰分析という考え方 p156 我々が最も学ぶべきは、バラつきを持つ現象に対する理論的な予測がそれほどうまくいかないという点である p164 (フィッシャーは) 「無制限にデータを得ればわかるはずの真に知りたい値」を真値と呼び、たまたま得られたデータから計算された統計量がどの程度の誤差で真値を推定しているかを数学的に整理することで、無限にデータを集めることなく適切な判断が下せるという考え方を示した。 単に一番もっともらしい値を推定するだけでなく、それが真値に対してどの程度の誤差を持っているかを考えれば、少なくとも間違った判断を犯すリスクは減らすことができる。 p166 回帰係数の推定値:真値を推定した結果 標準誤差:推定値の誤差の大きさ 95%信頼区間:p値が5%以下になる推定値の範囲 p値:5%を上回ると誤差と範囲される(低いほど正確) p170 一般化線形モデルをまとめた1枚の表
Posted by
統計学が最強の学問であるっ!! それはなぜかっ!? 「その答えを一言で言えば、どんな分野の議論においても、データを集めて分析することで最速で最善の答えを出すことができるからだ。」(p.8) う〜ん。 私は8割賛成。 確かに、データを集めて然るべき分析をすれば、最善の解は出てく...
統計学が最強の学問であるっ!! それはなぜかっ!? 「その答えを一言で言えば、どんな分野の議論においても、データを集めて分析することで最速で最善の答えを出すことができるからだ。」(p.8) う〜ん。 私は8割賛成。 確かに、データを集めて然るべき分析をすれば、最善の解は出てくると思う。 けど、結局それは多数決であって、少数の意見を無視することにならないかな? っていう疑問が払拭できないので、2割反対。
Posted by
- ネタバレ
※このレビューにはネタバレを含みます
痛快な本である。 序盤では、最近話題のビックデータについて、サンプリングの分からない経営者に高い機械を買わせようとするIT屋の謀略だみたいなことを言ったり、終盤では、英語が分からないからと言って海外の数字も見ないで思ったことだけを論じる評論家にダメ出ししたり、なかなか切れ味がいい。 ただ残念ながら学のない僕は、中盤の統計学の理論的なところは流し読みしてしまった。 結局、僕もダメな部類なのである。 今後、じっくり取り組む予定(本当?)
Posted by
Kindle化に惹かれて読んではみたがあまりお勧めできない。著者の専門上、仕方が無いことではあるが、視点が医療分野の統計応用に偏っていて、肝心の統計学の知識が浅い。本書と同じ嗜好の他の書籍としては「その数学が戦略を決める」が断然よい。
Posted by
統計処理を正しく理解するために、実際の事例や、統計の歴史などいろんなトピックを上げて解説してくれています。 非常に読みやすく役に立ちますが、さすがに後半の回帰分析になるとちょっと別の教科書で詳しく確認しないと追いつきそうにないですね。 統計を勉強するための動機付けに大いに役立ちま...
統計処理を正しく理解するために、実際の事例や、統計の歴史などいろんなトピックを上げて解説してくれています。 非常に読みやすく役に立ちますが、さすがに後半の回帰分析になるとちょっと別の教科書で詳しく確認しないと追いつきそうにないですね。 統計を勉強するための動機付けに大いに役立ちました! せっかうなので、昔大学で使っていた教科書見なおすついでに。R言語覚えてみましょうか。
Posted by