前処理大全 の商品レビュー
前処理について体系的に書かれているが、SQL、R、Pythonと3種類の言語を取り上げて書かれているためか、広く浅いという印象。参考になった点も多くあったが個人的にはPythonに限定してあるとよいと思った。欠損処理、カテゴリ変数の数値化については理論的なところをもう少し深堀りし...
前処理について体系的に書かれているが、SQL、R、Pythonと3種類の言語を取り上げて書かれているためか、広く浅いという印象。参考になった点も多くあったが個人的にはPythonに限定してあるとよいと思った。欠損処理、カテゴリ変数の数値化については理論的なところをもう少し深堀りしてもらうとよいと思う。
Posted by
ビジネス活用事例で学ぶデータサイエンス入門 10年戦えるデータ分析入門SQLを武器にデータ活用時代を生き抜く Rプログラミング本格入門 統計学入門 東京大学出版会 RstudioではじめるRプログラミング入門
Posted by
うーん。きれいなコードを書きましょう、的な本。 唯一いいと思ったのは自然言語処理向け前処理に使えそうなところ。やる予定ないのですが。
Posted by
表紙からして、めっちゃ堅い本かと思ってたのに、ユーモアもあって読みやすかった。 SQLの行間が気になった。行間ない方が読み易いんじゃないかな? Rについてはほぼ読んでない、、、SQLとPythonで十分だろ?と勝手に思ったので。 この場合はこうやった方がいいよ、でもここは注...
表紙からして、めっちゃ堅い本かと思ってたのに、ユーモアもあって読みやすかった。 SQLの行間が気になった。行間ない方が読み易いんじゃないかな? Rについてはほぼ読んでない、、、SQLとPythonで十分だろ?と勝手に思ったので。 この場合はこうやった方がいいよ、でもここは注意してねっていう書き方がとてもよかった。 Awesomeって普段使いしてる人には会ったことないけれど、Awesome!って言いたくなった(笑) 通勤電車で読んでたけど、本が重かったなぁ
Posted by
類書がぽろぽろ出てきたけど 安心の「ホクソエム」ブランド! 流行におもねらず本当に必要なことを正しい裏付けで明かしてくれる ドヤ顔もせずに 早速1つ実務で使った なんかさー1つの言語でゴリゴリ無理書きしようとするヒト多いよね 言語はそれぞれ得手不得手があるんだからさ 本書は...
類書がぽろぽろ出てきたけど 安心の「ホクソエム」ブランド! 流行におもねらず本当に必要なことを正しい裏付けで明かしてくれる ドヤ顔もせずに 早速1つ実務で使った なんかさー1つの言語でゴリゴリ無理書きしようとするヒト多いよね 言語はそれぞれ得手不得手があるんだからさ 本書はこれはSQLでこれはRでPythonでって明示しているのも好感
Posted by
知ってることも多かったけど、「実務ではこういうことがあるからこういう処理をしたほうがいい」的な実践的な話がちょいちょいあり、そういうところは役立った。 pythonの良い書き方とかも教えてくれているので役に立つ。
Posted by
データなんて全部から引っ張ればいいんてね?と思ってた考えを改めたることができた。 どうしてダメなのかの理由とプログラムがあるのがとても良い。
Posted by
実用書である。 なにかと派手な話題が多いデータサイエンスの中で、地味だが大切な前処理を取り上げている。 しかもSQL,R,Pythonの主要なツールについて併記してあり大変助かった。 今までSQLについてまったく知らなかったがなかなか奥深い分野と思われる。 第1章 前処理とは ...
実用書である。 なにかと派手な話題が多いデータサイエンスの中で、地味だが大切な前処理を取り上げている。 しかもSQL,R,Pythonの主要なツールについて併記してあり大変助かった。 今までSQLについてまったく知らなかったがなかなか奥深い分野と思われる。 第1章 前処理とは 第2章 抽出 第3章 集約 SQLのWindow関数は大変役に立つ関数が多い 第4章 結合 JOIN句の説明がわかりやすかった 4-3過去データの結合、4-4全結合はとても役に立ちそう。 第5章 分割 第6章 生成 第7章 展開 長いこと縦持ち、横持ちのことがわからなかったがpythonのpivot_tableでわかるようになった 第8章 数値型 数値のカテゴリ化など使えそう 数値の補完にこんな手法があったのは知らなかった(多重代入法) 第9章 カテゴリ型 カテゴリ型は結構大切 第10章 日時型 SQLの実行にPostgreSQLを使っていたがこの章ではエラーがでてほとんど実行できなかった データベースによっては方言が存在するのかな? 10-7 平日/休日への変換は役立ちそう 第11章 文字型 高度な内容だったので手がです 第12章 位置情報型 今回はデータとして緯度、経度が準備されていてそれを使うだけだったが その位置情報そのものを集めてくるのが大変そう まとめ データはデータベースに置きSQLでデータを前さばきしながらPython/Rでデータ加工するのが 最強のセットかな?SQLのWindow関数をもっと知りたい。
Posted by
- 1