バッドデータハンドブック の商品レビュー
図書館で借りた。 オライリーのデータサイエンス系の本。タイトルからは失敗談が並んでいそうだが、そこまで極端ではなかった印象で、データサイエンスのレポート集みたいな理解だ。 目次を見るといかにも洋書からのオライリー本という印象だ。ザ・体系的な日本の教科書の真逆で、目次ではこれらを読...
図書館で借りた。 オライリーのデータサイエンス系の本。タイトルからは失敗談が並んでいそうだが、そこまで極端ではなかった印象で、データサイエンスのレポート集みたいな理解だ。 目次を見るといかにも洋書からのオライリー本という印象だ。ザ・体系的な日本の教科書の真逆で、目次ではこれらを読めば何が身に付くかはパッとイメージできない。私の経験上、それでも中身に意義がある本はあったが、その見分けはつかない。 (すべてに目を通せてはないが、)私は合わなかったかな。意義をそこまで感じられなかった。 粘らずに返却した。
Posted by
バッドデータに関する本。バッドデータがなんなのか、ハッキリとは分からなかった。データ分析する前にしっかり処理しましょうね、という話なんだろうなとは思った。 エンコード、Webクロール、機械学習などさまざまなテーマ。20弱ある章がそれぞれ別の著者による担当のため、全体としての一貫...
バッドデータに関する本。バッドデータがなんなのか、ハッキリとは分からなかった。データ分析する前にしっかり処理しましょうね、という話なんだろうなとは思った。 エンコード、Webクロール、機械学習などさまざまなテーマ。20弱ある章がそれぞれ別の著者による担当のため、全体としての一貫性はあまり感じられなかった。 以下、Amazonページより引用 ---------------- 値の欠落、形式から外れたレコード、エンコーディング形式が不明な文字列。「バッドデータ」と聞いた時に思い浮べる典型例です。 しかし、これら以外にも「そもそもデータにアクセスできない」「消えてしまった」「昨日と違っている」「データはあるが形式が処理に適していない」など、 データを収集・分析するエンジニアは、これらの「バッドデータ」と正面から向きあわなければならないことが多々あります。 本書では、これらの問題のあるデータのパターンを紹介し、その対処法を解説しています。 19人のデータ分析の専門家が、自らの経験を通して得た、さまざまな教訓、実践的な方法論等を詳述した本書は、 ビッグデータ時代のエンジニアにとって必携の一冊となるでしょう。
Posted by
受け取ったデータが化けている場合から、統計データの取得方法に問題がある場合まで、「問題のあるデータ」というテーマでどう対処するかに関するコラム集、って感じかな。まあ一度目を通せば十分な感じ。
Posted by
データの前処理について参考になりうる事例もいくらか載っているのですが、実務家の応用に耐えうるという意味ではやや不満の残る内容であり、どちらかというと、非専門家のためのべからず集としてはやや有用であるのではないかと思います
Posted by
- 1