サイトリライアビリティエンジニアリング(SRE)とは、Googleで培われたシステム管理とサービス運用の方法論です。GoogleのSREチームの主要メンバーによって書かれた本書は、ソフトウェアのライフサイクル全体にコミットすることで世界最大規模のソフトウェアシステムがどのように構築、導入、監視、維持されているのかを解説します。はじめにリスク管理やサービスレベル目標、リリースエンジニアリングなどSREの行動の基礎となる原則について解説し、次にインシデント管理や障害の根本原因分析、SRE内でのソフトウェア開発など大規模分散コンピューティングシステムを構築し運用するSREの実践について詳述します。さらにSREのトレーニングやコミュニケーションなどの管理について紹介します。急速にスケールするサービスを高い信頼性で運用する方法を解説する本書はエンジニア必携の一冊です。
人気のある作家
できるシリーズ編集部 (48) 技術評論社編集部 (48) リンクアップ (48) 相川正樹 (35) 日経Linux (26) standards (26) リブロワークス (24) 株式会社クイープ (23) 晋遊舎 (22) 年賀状素材集編集部 (21) インプレス年賀状編集部 (20) 横山了一 (18) 山田 祥寛 (18) メディアックス (13) 掌田 津耶乃 (11) 廣瀬 豪 (10) 森 巧尚 (10) 北村 愛実 (9) 吉川 邦夫 (9) 井上 香緒里 (9)