AWSではじめるデータレイク の商品レビュー
後半のハンズオンは具体的かつ目的が明確で雰囲気を掴むことができた。 前半の理論と概要について、分かりやすいものの、特定の視線に寄っていたり、AWS特定のサービスについて詳しすぎたりする。はじめて見知るなら、まぁいいのか
Posted by
ハンズオン部分はもちろん良いが、序盤のデータレイクの概念とデータ分析の課題など背景的なところの説明が知りたかったところなので非常に役に立った。 ハンズオン部分はやっていないので評価なしの意味で星4。
Posted by
『ビッグデータを支える技術』が理論を提供する本であれば、こちらは実践を提供する本である。SparkやHadoopを自前で運用するのは難しく、ビジネス要求からすれば本質ではない。本質はデータ解析である。であれば、AWSのマネージドサービスを利用するほうが良い。 ハンズオンは基礎編...
『ビッグデータを支える技術』が理論を提供する本であれば、こちらは実践を提供する本である。SparkやHadoopを自前で運用するのは難しく、ビジネス要求からすれば本質ではない。本質はデータ解析である。であれば、AWSのマネージドサービスを利用するほうが良い。 ハンズオンは基礎編と応用編に分かれている。基礎編ではQuickSight, Redshift, Athena, Glue を取り扱うが、QuickSightとRedshiftはこれまで業務で縁がなかったためハンズオンで大いに学ぶことができた。AthenaとGlueは業務で少しやればこのハンズオン以上の知識が既に入っている、というようなレベル感だ。 応用編はログ分析の基盤を作るハンズオンでかなり重量級である。やり抜けば即実戦投入とはいかなくても、ログ分析周りの技術に知見がない状態から脱し、自社での応用を考えるところまではいけるだろう。
Posted by
AWSを用いた分析環境作りを行う上での教科書 考え方やベストプラクティスが参考になる ●基本的なデータの流れ ①各部署やツールに散在しているデータ ②データレイク(真のデータ・生データの保管) ③DWH(目的を満たす分析データの格納) ④データマート(BIに食わせる前のデータ)...
AWSを用いた分析環境作りを行う上での教科書 考え方やベストプラクティスが参考になる ●基本的なデータの流れ ①各部署やツールに散在しているデータ ②データレイク(真のデータ・生データの保管) ③DWH(目的を満たす分析データの格納) ④データマート(BIに食わせる前のデータ) ・②→③が目的志向で加工した(でも最小粒度)のデータの格納がキモ。事業目的は変化するので難易度が高い。
Posted by
- 1
