Runbook
ランブーくん for Cowork
📋 プロンプトテンプレート

以下の情報をもとに、SRE運用手順書(ランブック)を作成してください。

入力情報

  • 手順書の種類

    • インシデント対応手順(障害発生時)
    • 定期運用オペレーション(バッチ・デプロイ・メンテナンス)
    • 障害復旧手順(DR / フェイルオーバー)
    • アラート対応手順(監視アラートごとのRunbook)
  • 対象システム・サービス名:〔例:決済APIサービス / 認証基盤 / データパイプライン〕

  • インフラ・技術スタック:〔例:AWS ECS / Kubernetes (EKS) / RDS PostgreSQL / Datadog〕

  • 手順の概要(メモ・箇条書きで可):

    〔例:CPUアラート発報 → ログ確認 → スケールアウト → 原因調査 → 報告〕
    
  • 影響範囲・重要度:〔例:全ユーザーに影響 / 一部機能のみ / バックグラウンド処理のみ〕

  • SLO / SLA:〔例:可用性99.9% / RTO 30分以内 / RPO 1時間以内〕

  • エスカレーション先

    フェーズ担当連絡手段
    一次対応〔例:オンコール担当〕〔例:PagerDuty〕
    二次対応〔例:SREリード〕〔例:Slack #incidents〕
    経営報告〔例:VP of Engineering〕〔例:電話〕
  • 既知の関連インシデント・前例(任意):

    〔過去の類似障害・対応履歴のメモ〕
    

作成内容

1. 概要セクション

  • 目的・適用範囲・前提条件
  • 想定所要時間・難易度・必要な権限

2. 前提チェックリスト

  • 実行前に確認すべき事項(権限・依存サービスの状態など)

3. 手順(ステップバイステップ)

各ステップに以下を含める:

  • コマンド・操作(コードブロック付き)
  • 期待される出力・確認ポイント
  • 異常時の分岐→ 正常の場合:次のステップへ / → 異常の場合:手順Xへ
  • 推定所要時間

4. 検証・確認手順

  • 対応完了を確認するためのチェック項目
  • 監視ダッシュボード・メトリクスの確認方法

5. ロールバック手順

  • 対応を元に戻す必要が生じた場合の手順

6. インシデントレポート記載項目

  • 発生日時・検知方法・影響範囲
  • タイムライン(検知 → 対応開始 → 解消)
  • 根本原因(RCA)・再発防止策

7. 関連リンク

  • ダッシュボード・ログ・アーキテクチャ図・過去インシデントへのリンクプレースホルダー

作成ルール

  • コマンドは実際にコピー&ペーストして使えるよう、コードブロックに入れること
  • 変数・環境依存部分は ${VARIABLE_NAME} 形式でプレースホルダーを示すこと
  • 判断が必要な箇所には「⚠️ 注意」「✅ 確認」などの視覚的マーカーを付けること
  • 手順は誰でも(深夜のオンコール担当でも)迷わず実行できる粒度で書くこと

出力形式

Markdown形式で出力してください。 Confluenceへの貼り付けやGitHub上での管理を想定した構成にしてください。

💡 使い方
上のテンプレートをコピーして Claude Coworkに貼り付け、 〔〕で囲まれた箇所をご自身の情報に書き換えてお使いください。