SRE運用手順書（ランブック）を作成する — ランブーくん for Cowork

ランブーくん for Cowork

📋 プロンプトテンプレート

以下の情報をもとに、SRE運用手順書（ランブック）を作成してください。

入力情報

手順書の種類：
- インシデント対応手順（障害発生時）
- 定期運用オペレーション（バッチ・デプロイ・メンテナンス）
- 障害復旧手順（DR / フェイルオーバー）
- アラート対応手順（監視アラートごとのRunbook）
対象システム・サービス名：〔例：決済APIサービス / 認証基盤 / データパイプライン〕
インフラ・技術スタック：〔例：AWS ECS / Kubernetes (EKS) / RDS PostgreSQL / Datadog〕

手順の概要（メモ・箇条書きで可）：

〔例：CPUアラート発報 → ログ確認 → スケールアウト → 原因調査 → 報告〕

影響範囲・重要度：〔例：全ユーザーに影響 / 一部機能のみ / バックグラウンド処理のみ〕
SLO / SLA：〔例：可用性99.9% / RTO 30分以内 / RPO 1時間以内〕

エスカレーション先：

フェーズ	担当	連絡手段
一次対応	〔例：オンコール担当〕	〔例：PagerDuty〕
二次対応	〔例：SREリード〕	〔例：Slack #incidents〕
経営報告	〔例：VP of Engineering〕	〔例：電話〕

既知の関連インシデント・前例（任意）：
```
〔過去の類似障害・対応履歴のメモ〕
```

作成内容

1. 概要セクション

目的・適用範囲・前提条件
想定所要時間・難易度・必要な権限

2. 前提チェックリスト

実行前に確認すべき事項（権限・依存サービスの状態など）

3. 手順（ステップバイステップ）

各ステップに以下を含める：

コマンド・操作（コードブロック付き）
期待される出力・確認ポイント
異常時の分岐（→ 正常の場合：次のステップへ / → 異常の場合：手順Xへ）
推定所要時間

4. 検証・確認手順

対応完了を確認するためのチェック項目
監視ダッシュボード・メトリクスの確認方法

5. ロールバック手順

対応を元に戻す必要が生じた場合の手順

6. インシデントレポート記載項目

発生日時・検知方法・影響範囲
タイムライン（検知 → 対応開始 → 解消）
根本原因（RCA）・再発防止策

7. 関連リンク

ダッシュボード・ログ・アーキテクチャ図・過去インシデントへのリンクプレースホルダー

作成ルール

コマンドは実際にコピー&ペーストして使えるよう、コードブロックに入れること
変数・環境依存部分は ${VARIABLE_NAME} 形式でプレースホルダーを示すこと
判断が必要な箇所には「⚠️ 注意」「✅ 確認」などの視覚的マーカーを付けること
手順は誰でも（深夜のオンコール担当でも）迷わず実行できる粒度で書くこと

出力形式

Markdown形式で出力してください。 Confluenceへの貼り付けやGitHub上での管理を想定した構成にしてください。

💡 使い方

上のテンプレートをコピーして Claude Coworkに貼り付け、〔〕で囲まれた箇所をご自身の情報に書き換えてお使いください。