ヤバい統計 の商品レビュー
『問題は、そのようなときに役立つ「グッドデータ」【統計学的に理想的な良質のデータ】が、常に手に入るわけではないという点だ。(中略)一般に、物事は重要とみなされるようになって初めて数えられるようになる』―『はじめに』 まず最初に言っておきたいのは、本書はいわゆる「統計学」の教科書...
『問題は、そのようなときに役立つ「グッドデータ」【統計学的に理想的な良質のデータ】が、常に手に入るわけではないという点だ。(中略)一般に、物事は重要とみなされるようになって初めて数えられるようになる』―『はじめに』 まず最初に言っておきたいのは、本書はいわゆる「統計学」の教科書、あるいは、統計的手法を扱う人に向けた啓蒙書という訳ではない、ということ。もちろん、統計による推計の結果を扱う人が(回りくどい言い方だが)注意しておかなければならないことを丁寧に記した本ではあるのだけれど。本書の対象となるのは、どちらかと言えば統計学の基礎も統計的手法にも余り馴染みのない人であって、そんな人たちに向けて、推計が意味する(あるいは意味しない)ことを説く書。書評にも、本書のことわり(はじめに)にも、その主旨(本書には統計手法についての書ではなく数式も図も出て来ない)は記されているのだけれど、少しだけ期待していたものがあった。 著者が統計的手法を用いて推定する対象は、純粋に(自然科学が扱う対象物の特徴を捉えるために行う意味での)観測された数値ではない。その多くは一般に質的データ(名義尺度あるいは順序尺度)あるいはそれを標準化して数値に置き換えたデータだ。自然科学における観測対象ではなく社会科学における観測対象の統計につきまとう難しさが本書の主たるテーマであると言ってよいと思う。自然相手に観測されたデータ解析を一生懸命やってきた身からすると、そこが期待していたモノから逸れてしまう一因となるのだけれど、もともと期待していたのは統計手法の話ではない。実はデータ解析をする上で一番気を付けなければならないのは数学的な理論や算術的な工程ではなく、どうデータが準備されているかということなのだが、そのことについて著者が語ることに興味があったのだ。 著者はデータの観測に恣意が入る可能性について丁寧に説明している。それは自然科学分野の観測でも同じことなので首肯することも多い。一方で、もう少し異なる角度から語られるかも知れないと期待していたのは、いわゆる観測対象の選択(関心領域: area of interest)について。観測に絡む恣意性ということでは同じような主旨の話なのだけれど、その無意識の選択によって結果が左右されるという文脈で語られているところを越えて、その無意識の選択を如何に避けるか、あるいは補正していくかということについての言及がもう少しあることを期待していたのだ。 それは後進を指導する時に最も納得してもらうのが難しい(もちろん、説明すれば解ってもらえるのだが、データをもてあそぶ程には興味を持ってもらい難い)ことなのだ。そもそも統計の根本の課題は、標本の統計量をどの程度母集団の統計量と見做してよいか、であるのは当然なのだが、そんな深遠な問いの前に、個々のデータの解像度の差、取得された時の条件の違い、そもそも何処で取得されたものを集めているのか、といったことを、計算機をぶん回す前に吟味することの大切さ、そしてそこに結果を無意識の内に誘導してしまうリスクがあること、そんな話がもう少しあるのかなと思っていた(もちろん、少し異なる設定での話は語られているのだが)。 世の中、やれビッグデータだのデータオリエンテッドだの探索的データ解析だのと言うけれど、本書の一項目にもあるように、結局昔から言われる通り、Garbage-in, Garbage-out(ゴミを入力すれば結果もゴミ)なのだから。
Posted by
原題は「Bad Data」。「ヤバイ統計」という日本語タイトルはどうかな。なんとなく違和感。 正確な統計処理は難しい。 その、「歪み」の原因を、いろんな視点から切り込む。 類書は多い。 著者は英国の中央で統計関係の仕事に取り組んでいるので、事例は英国の、政策絡みにほぼ限定されて...
原題は「Bad Data」。「ヤバイ統計」という日本語タイトルはどうかな。なんとなく違和感。 正確な統計処理は難しい。 その、「歪み」の原因を、いろんな視点から切り込む。 類書は多い。 著者は英国の中央で統計関係の仕事に取り組んでいるので、事例は英国の、政策絡みにほぼ限定されているところが他と違うかな。 極めて散文的で、ざっと読むにはいい。 AIに関する項もあったのが新しいかな。 それくらい。
Posted by
見える化にうるさい方々に読んで欲しい。 バッドデータは所詮バッドデータ、こねくり回せば事態はさらに悪化する
Posted by
世の中に出ている統計データが「グッドデータ」に基づいたものでないことがあることを説明された本でした。政府、国連や科学誌に載るような論文にも「バッドデータ」に基づいたものがあり、我々はそのデータを鵜呑みにせず疑ってかかるべきなんだと思いました。ただ、全体としてバッドデータを用いたこ...
世の中に出ている統計データが「グッドデータ」に基づいたものでないことがあることを説明された本でした。政府、国連や科学誌に載るような論文にも「バッドデータ」に基づいたものがあり、我々はそのデータを鵜呑みにせず疑ってかかるべきなんだと思いました。ただ、全体としてバッドデータを用いたことに対する批判に終始しており、途中で読むのを中断しようかなと思いましたので、星は3にしました。ただ、最後に著者の思いが語られて、まとまりとしては良かったなと思います。
Posted by
- 1