Chapter 6 対応区分・ログ設計ルール
― 判断と結果を確実に残すための記録設計

運用や障害対応で本当に困るのは、
「その時、何が起きたか」ではありません。
-
なぜその判断をしたのか
-
なぜその対応を選んだのか
-
結果として何が得られたのか
これらが 後から辿れないこと が、最大の問題です。
本 Chapter では、
判断・対応・結果を一貫して残し、次の判断を不要にするための対応区分とログ設計を整理します。
6-1. ログがない運用は、毎回ゼロから考える運用になる
ログが残っていない運用では、次のことが必ず起きます。
-
同じ障害を何度も調査する
-
過去の判断を再現できない
-
判断基準が属人化する
これは、
経験が蓄積されない構造です。
人が入れ替わるたびに、
運用は振り出しに戻ります。
6-2. 「緊急かどうか」を感情で決めてはいけない
多くの現場では、
-
声が大きい
-
不安そうに見える
-
急いでいそう
といった 感情的要素 で緊急度が決まります。
これは危険です。
緊急かどうかは、
定義によって機械的に決めるもの です。
6-3. 対応区分は事前に固定する
本運用では、対応区分を次の2つに明確に分けます。
緊急対応
-
サービス停止・重大劣化
-
影響範囲が広い
-
即時判断が必要
→ 判断者が即座に関与する
通常対応
-
影響が限定的
-
代替手段が存在
-
計画対応が可能
→ 通常の運用フローで処理する
この区分を 事前に固定 することで、
現場で迷いが発生しません。
6-4. ログに残すべき最低限の情報
ログは、詳細である必要はありません。
重要なのは、判断の再現性です。
最低限、次の情報を残します。
-
事象:何が起きたか
-
判断:なぜそう判断したか
-
対応:何を実施したか
-
結果:どうなったか
-
次回への示唆:今後どう活かすか
これが揃っていれば、
後から判断を追体験できます。
6-5. ログは「報告」ではなく「判断資産」
ログを書くことを、
-
報告義務
-
作業記録
と捉えると、必ず形骸化します。
ログは、
次の判断を楽にするための資産です。
-
次は判断しなくてよくなる
-
対応方針が事前に見える
-
迷いが減る
この実感があると、
ログは自然に書かれるようになります。
6-6. ログが運用を進化させる流れ
正しくログが残ると、次の循環が生まれます。
-
判断・対応が記録される
-
判断基準が明確になる
-
再発時の判断が不要になる
-
日常運用に戻せる範囲が広がる
これにより、
-
判断の頻度が減り
-
運用が軽くなり
-
改善が蓄積されていきます
6-7. 記録されない判断は、存在しない判断と同じ
口頭やチャットで行われた判断は、
記録されなければ存在しないのと同じです。
-
誰が決めたか分からない
-
なぜそうしたか分からない
-
責任が追えない
この状態を防ぐために、
判断は必ずログとして固定します。
まとめ
運用を安定させ、進化させる鍵は、
判断を減らすこと ではありません。
判断を残すこと です。
-
対応区分を事前に定義する
-
判断・対応・結果を必ず記録する
-
記録を次の判断不要につなげる
この設計によって、
運用は属人性を失い、
「勝手に進む構造」に近づいていきます。
Chapter 0 コミュニケーション・判断・運用基盤 ― 役割と責任を固定し、判断と行動が自動連動する構造
Chapter 1 Backlog=判断コミュニケーションの正本 ― 会話と判断を分離し、行動を自動連動させる運用設計
Chapter 2 課題粒度と責任単位の定義 ― 1課題=1判断=1行動で、運用を止めない設計
Chapter 3 起票ルール ― 件名で行動を即決させる運用設計
Chapter 4 Backlogテンプレート設計 ― 会話を不要にする運用構造
Chapter 5 運用保守コミュニケーションルール ― 判断不要で進む範囲を定義する運用設計
Chapter 6 対応区分・ログ設計ルール ― 判断と結果を確実に残すための記録設計





