データ分析基盤 構築入門 の商品レビュー
Elasticsearch, Kibana, Fluentdでログを整形して可視化する基盤の構築方法が書かれている。ページ数のわりにほとんどはスクリーンショットと冗長なコードでこれならばインターネットで調べながら学ぶ方がよかったとも思ったが、サンプルコードがGitHubに用意され...
Elasticsearch, Kibana, Fluentdでログを整形して可視化する基盤の構築方法が書かれている。ページ数のわりにほとんどはスクリーンショットと冗長なコードでこれならばインターネットで調べながら学ぶ方がよかったとも思ったが、サンプルコードがGitHubに用意されており、docker-composeでクラスタを立ち上げられるのは良い。ただ、そのコードが一部動かなかったのでGitHubでISSUEを立てたのだが無視され続けている。
Posted by
1章 データ分析の概要 2章 ログデータの基礎 3章 データ分析基盤の構築 4章 データ分析基盤の運用 5章 ログ収集ミドルウエアの紹介 概要の紹介 6章 はじめてみようFluentd データ転送ツールであるFluentdの説明。Input->Filter->Ou...
1章 データ分析の概要 2章 ログデータの基礎 3章 データ分析基盤の構築 4章 データ分析基盤の運用 5章 ログ収集ミドルウエアの紹介 概要の紹介 6章 はじめてみようFluentd データ転送ツールであるFluentdの説明。Input->Filter->OutPutとプラグインを活用してストリームデータを流していくデータのルーティングの基本となっているのはタグとラベル。 treasuredata社がメンテナンスしている。 7章 Fluentd設計のこつ tailプラグインの使い方、Fluentdノードのデザインパターン。これはFluentdを複数配置させ末端のFluentdノードには無理をさせずアグリゲ-タノードでデータ集約させて通信量を抑えるなど工夫を紹介。Fluentdを多重化配置させ障害につよい構成。 8章 Fluentd運用Tips Fluentdの監視、性能評価について紹介。ログ欠損対策であるバッファリングの設定など。 第3部 Elasticsearch,kibanaは省略 Appendix Embulk、Digdag入門 EmbulkこのツールもおもしろいFluentdと同じ作者さんがつくっているとか
Posted by
fluentdは本当にすごい発明だと思う。 データストアと可視化ツールは本書でも触れられているように、Elasticsearch以外に選択肢が沢山ある。 データのストリーミングはfluentd以外もう考えられない。 プラグインを書いてくれている方たちには感謝してる。
Posted by
会社にあったので読んでみました。 Splunk や Elasticsearch などの基盤を一通り解説。 あくまで基盤の本なので、「どういう分析ができるか?」といった点はありません。
Posted by
- 1