- 中古
- 書籍
- 書籍
データは騙る 改竄・捏造・不正を見抜く統計学
定価 ¥2,200
550円 定価より1,650円(75%)おトク
獲得ポイント5P
残り1点 ご注文はお早めに
発送時期 1~5日以内に発送
商品詳細
内容紹介 | |
---|---|
販売会社/発売会社 | 早川書房 |
発売年月日 | 2019/02/20 |
JAN | 9784152098412 |
- 書籍
- 書籍
データは騙る
商品が入荷した店舗:0店
店頭で購入可能な商品の入荷情報となります
ご来店の際には売り切れの場合もございます
お客様宅への発送や電話でのお取り置き・お取り寄せは行っておりません
データは騙る
¥550
残り1点
ご注文はお早めに
商品レビュー
3.9
13件のお客様レビュー
- ネタバレ
※このレビューにはネタバレを含みます
数字というものは実に力強い。 数字で表現すると他者との比較が可能になるし、過去との比較が可能になるし。相関性についても、ほら相関係数が1に近づいています、というとなるほど確かに、などと思ってします。 ところが、ところが、実は数字だって怪しいものがある、しかも相当ある、というのが本書の主張するところです。 ・・・ 本作、19章に渡って、これはおかしい、あれはおかしいとまくし立てております。夫々、なるほどと思うことがあります。 分かったり分からなかったりしましたが、印象深かったものを以下に記したく存じます。 ・・・ <生存者バイアス> 第二章で図入りで解説されています。 英国空軍が帰還飛行機の被弾状況を見て、どこを補強すれば生還率が上がるかという話。 A:「コクピットやエンジン、燃料タンクよりも、被弾が多かった翼と後部部分を補強」 B:「コクピット、エンジン、燃料タンクを更に補強」 答えはBでした。 コクピットやエンジン・燃料タンクに被弾した飛行機は撃ち落されてそもそも帰還できず観察されなかった。一方、帰還した飛行機の被弾状況を見ると「これは被弾している翼部分や後部を補強すればよい」と考えてしまうわけです。つまり生き残っているものだけをみてはいけない。 帰還率を上げるには、墜落の原因になったコクピット・エンジン・燃料部分を補強すること、というのが結論になり、実際うまくいったという話。 同じような誤りを、かの有名な「ビジョナリーカンパニー」も犯していると主張。 今生き残っている優秀企業(のみ)から成功の源を探るものですが、同じ特性を持っていても途中で潰れた会社もあるわけです。正しい分析をするのならば、同じ特性を持つ企業をピックアップし、そこからアウトパフォームできるかを(つまり生存者バイアスを除いて)将来に向けて確認する必要がある、という主張です。 ・・・ <相関関係は必ずしも因果関係ではない> 第三章の例で、ビールの消費量と結婚者数がグラフで書かれています。どちらも右肩上がり。これを見て、「アルコール消費量が増えると結婚するカップルが増える」という結論が演繹したとします。 もちろん、これは間違い。 背後に人口が増加しているというベースストーリがあるとすれば、応じてビール消費量もカップル数も増加して全くおかしくありません。 計算上は、アルコール消費量とカップル数は相関性が見いだせるということ。故に改めて確認するべきは、相関性が因果を示すわけではない、ということ。 ・・・ <パターンを見て理論がないもの(テクニカル分析)> 米国だとスーパーボール(アメフトの日本シリーズみたいなもの)の勝ち負けで株価が上がる下がるなどとまことしやかに言います。筆者はこれを偶然と言い、同様のことを株式のテクニカル分析にも指摘します。 パターンがあって、そこに理論(説明)を当てはめただけで、ある現象の説明を仕切れていないという主張です。 こちらについては16章に詳しいです。 ・・・ <その他> ・理論を立ててから、合致するデータを持ってくるもの(不整合なデータの切り捨て) ・データを集めて当てはまるところを取り上げるもの ・グラフを拡大し大きな上下に見せかけるなど こうした事例を多く示していましたが、科学に従事する人であろうと、見たいものしか見たくないという心の状況がデータの欠落(意図的か偶然かによらず)につながっているということなのかもしれません。 因みに最終章(19章)はまとめのような形であり、時間がない方は先ずこちらを読むと概ね内容が分かるかと思います。 ・・・ ということでデータの見せ方のお話でした。 非常に参考になりました。 数字を使って流麗に説明されると、感覚的におかしいなと思っても説明・反論ができないとそのまま会議でも流されてしまうことが多々あります。 そういう「もやもや」を言語化をする上で本書は有用だと思います。数字だって使い方がおかしければ、やはり正しくないのです。 数字をベースに仕事をされたい方、投資を良くされる方、ギャンブルと確率について関心のある方等には参考になると思います。
Posted by
データドリブンを装う理論や研究成果も、十分に疑ってかかるべきということを、様々な類型と実例で示した書籍。 ランダムサンプリングしたつもりでも自己選択バイアス(ある選択をした者に共通する傾向。A大学とB大学の卒業率を比較する時、入学時の学生の特性そのものが異なるため慎重に比較検証す...
データドリブンを装う理論や研究成果も、十分に疑ってかかるべきということを、様々な類型と実例で示した書籍。 ランダムサンプリングしたつもりでも自己選択バイアス(ある選択をした者に共通する傾向。A大学とB大学の卒業率を比較する時、入学時の学生の特性そのものが異なるため慎重に比較検証すべき)や生存者バイアス(帰還した戦闘機から被弾箇所の傾向をみようとしない。致命的な場所に被弾した戦闘機は帰還しない)でデータはすでに偏っているかもしれない。 交絡因子(結果に影響する別の因子の偏り)が検証結果に影響を及ぼしているかも知れない(コーヒーを飲む者の癌になる確率は高いが、これは喫煙率が高いためで、コーヒーに発ガン性があるわけではない)。 自然選択の結果、人間はあらゆる事象に法則性を見いだしてしまう癖がついていることに由来する誤りもある。 平均への回帰はシンプルに確率の問題だが、何らかの意味があると勘違いしてしまう。 大数の法則の誤った解釈で、これまでの試行結果の偏りが次の独立した試行の結果に影響すると思い込んでしまう。単なるランダムな偏りにも人は法則性を見いだしてしまう。 これに加えて、研究者は新たな理論とその統計的に有意な検証を求める強いインセンティブがあり、都合の良いデータを求めてしまったり、データをこねくり回して何らかの(実際にはランダムな偏りの一つに過ぎない)法則性を見つけてしまったり、果ては捏造したりする。 受け手として留意すべきことは、不自然なデータの取り方は疑ってかかり、常識的におかしい説は疑い、理論を見つけたデータとは異なるランダムな新データで検証されたものを求めなければならない。
Posted by
統計データのゆがみについて 最後の章にまとめがあるので引用 パターンの誘惑 間違った、あるいはバイアスのかかったデータ 怪しいグラフ・データの省略 よく考えずに計算する 交絡因子がないか 絶好調の波vs大数の法則の誤解 平均への回帰 テキサスの狙撃兵(たくさんデータを集めて都合の...
統計データのゆがみについて 最後の章にまとめがあるので引用 パターンの誘惑 間違った、あるいはバイアスのかかったデータ 怪しいグラフ・データの省略 よく考えずに計算する 交絡因子がないか 絶好調の波vs大数の法則の誤解 平均への回帰 テキサスの狙撃兵(たくさんデータを集めて都合のよい部分だけ抜き出す) 理論なきデータvsデータなき理論
Posted by