入門監視 の商品レビュー
もっと早く読んでおけばよかった本です。 監視のアンチパターンやデザインパターン、良いアラートの仕組みなど、監視についてギュッと濃い内容でまとまっています。 あと、付録Cとしてsongmuさんが書かれた実践 監視SaaSも非常に勉強になりました。
Posted by
メトリクス例 アクション毎の失敗率、レイテンシ ログイン失敗率、ログイン処理のレイテンシ 秒間リクエスト数、httpステータス 秒間クエリ数、iops キューの長さ、消費率 手順書 サービスの概要 コンポーネント構成 機能一覧 ソースリポジトリ ...
メトリクス例 アクション毎の失敗率、レイテンシ ログイン失敗率、ログイン処理のレイテンシ 秒間リクエスト数、httpステータス 秒間クエリ数、iops キューの長さ、消費率 手順書 サービスの概要 コンポーネント構成 機能一覧 ソースリポジトリ 責任者 エスカレーション手順 依存性 外部サービス 内部プロダクト インフラ構成 技術スタック メトリクス、ログの説明 アラートの説明 インシデント管理 認識 記録 自動的にチケット登録 診断、分類、解決、クローズ 問題発生中のコミュニケーション管理 解決後の改善策検討
Posted by
著者の経験に基づいた監視のノウハウが書かれている。基本的に実務を重視していて、監視が不十分だとどのような問題が起こるか、監視によってどのような恩恵が得られるかといった潜在的な話がメインとなっている。例えば、どのようなメトリクスがありどのようなアラートを設定した場合効果的に機能する...
著者の経験に基づいた監視のノウハウが書かれている。基本的に実務を重視していて、監視が不十分だとどのような問題が起こるか、監視によってどのような恩恵が得られるかといった潜在的な話がメインとなっている。例えば、どのようなメトリクスがありどのようなアラートを設定した場合効果的に機能するか、どのようなルールで運用を行うとうまく行くか、どのようなツールがあるかといったことを例を上げながら説明している。冒頭に特定のツールに依存しないと書いてあるが、実際はかなりの種類のツールが名指しで出てきて称賛されたりディスられたりしている。 本書で一貫しているのは、様々なコストを抑えることが重要で監視はそれに対する手段であると述べられている。近年の監視であればSaaSを用いるのは非常に良い方法で多くの場合ヒューマンリソースのコストよりも安くつくと述べている。また、過度なアラートは厳禁であり、必要十分なアラートを飛ばすということも述べており、これは人的コストの消費に加えて、チームを疲弊させて生産性を落とす原因になると述べている。どうやら著者はネットワークエンジニアあがりらしいのだが、SNMPをディスっていて、それ以外にロクな方法がないので仕方なく使っているみたいな話をしていた。 全体を通した感想としては、監視初心者が読むには得るものが多くて良いと思うが、それなりに経験を積んだエンジニアが得るものはあまりないのではとも思う(ただ、入門監視というタイトルなのでそれで正しいのかもしれないが)。この本を読んで監視について普遍的で体系的な技術を得たいという人にもあまり向いていないと思っていて、著者の経験をそのままアウトプットしたような本なので章の内容の深さにムラがあり、かつ、2017年の時点での技術に依存した話も多い(実際、仮想環境やマイクロサービスの監視の話は少なめ)。とはいうものの、読み物としては面白く、著者の経験に依存する話ということについても、経験を余すことなくアウトプットしてくれているという観点からはポジティブに評価できる。ただ、内容量的にはやはり物足りない...
Posted by
今まで運用して来た人にとって、すごく画期的な内容ではないが、今までの答え合わせ的にも利用できると思った。
Posted by
監視の原則やデザインパターンを体系だって学ぶことで、自己流の監視のアンラーニングを目的に読みました。 [https://www.oreilly.co.jp/books/9784873118642/:embed:cite] 本書は監視の原則から始まり、知りたいことが体系立って書...
監視の原則やデザインパターンを体系だって学ぶことで、自己流の監視のアンラーニングを目的に読みました。 [https://www.oreilly.co.jp/books/9784873118642/:embed:cite] 本書は監視の原則から始まり、知りたいことが体系立って書かれていました。 - 監視の定石であるデザインパターン - 障害に対する適切なアラートのコントロール方法 - 統計的なデータの扱い方の特徴と注意点 - 平均値 vs 中央値 - パーセンタイル - サービスの成長に伴う監視システムの内製/SaaSの選定、戦略 - ビジネスKPIに紐づく監視戦略と監視項目、各社の具体例 - ネットワーク〜Linuxカーネル〜アプリの技術スタックと監視内容 - セキュリティ監視 特にIaaSの技術スタックに関する知識に偏りがちだった自分にとって、監視SaaSを組み合わせたメリットやデザインパターンはインプットになりました。 並行して読んでいるSite Reliability Engineeringが抽象度高く書かれており、具体例を補うものとして本書はとても役に立ちました。
Posted by
自分としては知っている内容も多かったが、心得的なところは監視版リーダブルコードと言っても良い気がする。 ある程度監視をやった事がある人の答え合わせをするには良い気がするが、入門と言われると入門書として手に取った人には抽象的でよく分からない内容が多いのではないか。 ネットワーク、サ...
自分としては知っている内容も多かったが、心得的なところは監視版リーダブルコードと言っても良い気がする。 ある程度監視をやった事がある人の答え合わせをするには良い気がするが、入門と言われると入門書として手に取った人には抽象的でよく分からない内容が多いのではないか。 ネットワーク、サーバー、フロント、バックエンド、KPIと広く浅くカバーする。 しかし具体的に何をやるか?という点にはあまり触れられていないので、そういう今すぐ何か知識を得て活かしたいという人には本書は向いていない。 最後の辺りはMackerelの宣伝。 知ってる内容が多くて薄っぺらいという評価が多いが、SNMPの監視やbwctl使ったモニタリングとか本当にやった事あるんか??という気がしつつみんなのレビューを読んだ。
Posted by
ツールの使い方ではなく、概念的なところから説明があり「監視とはどういう行為なのか」やっと腑に落ちた。なんとなく監視をやっていたいままでと比べ監視に対する態度が変わった。
Posted by
監視システムの知見を広げるために読み始めたが、むしろ、システムにかかわる人すべてに役立つ内容であることが理解できた。つねに手元に置いておきたい本である。 以下のような気付きがあった。 ・世界レベルの監視の仕組みは、継続的な改善によってのみ達成できる。逆を言えば、誰だって継続的改...
監視システムの知見を広げるために読み始めたが、むしろ、システムにかかわる人すべてに役立つ内容であることが理解できた。つねに手元に置いておきたい本である。 以下のような気付きがあった。 ・世界レベルの監視の仕組みは、継続的な改善によってのみ達成できる。逆を言えば、誰だって継続的改善を実践すれば、世界レベルの監視の仕組みを構築することができる、ということである。継続的改善が可能な監視システム、というコンセプトも面白いかもしれない。 ・フロントエンド監視のメトリクスが提示されていて、使えそうである。 ・データベースにおけるスロークエリーは、パフォーマンスの重要な指標である。
Posted by
オリジナルは『Practical Monitoring』。 まず監視のあるべき姿を論じており、具体的な監視サービスの使い方にはページを割いていない。収集すべきデータや効果的なアラート等、これから監視設計する立場として非常に勉強になった。 監視データに関する内容はすべて自前でインフ...
オリジナルは『Practical Monitoring』。 まず監視のあるべき姿を論じており、具体的な監視サービスの使い方にはページを割いていない。収集すべきデータや効果的なアラート等、これから監視設計する立場として非常に勉強になった。 監視データに関する内容はすべて自前でインフラを管理している場合にも適用可能な内容となっており、 AWS 等のクラウドインフラサービスを使う場合は特に設定せずとも収集されるデータも多い。この"監視データの収集設定が設定済み"というのもクラウドサービスを使う最大のメリットの一つであるなという気づきもあった。 DevOps や DevSecOos が声高に叫ばれる今のエンジニアリングにおいて、すべてのエンジニアにおすすめできる一冊。
Posted by
前評判が良かったので期待したが、中身は広く浅くだった。 なぜ監視するのか、アラートはどうあるべきか、そういった話を書いてくれている点はとても良かったので、具体例にもう一歩踏み込んでほしかった。 System Performanceと併用すると良い。
Posted by