📋 プロンプトテンプレート
以下の情報をもとに、SRE運用手順書(ランブック)を作成してください。
入力情報
-
手順書の種類:
- インシデント対応手順(障害発生時)
- 定期運用オペレーション(バッチ・デプロイ・メンテナンス)
- 障害復旧手順(DR / フェイルオーバー)
- アラート対応手順(監視アラートごとのRunbook)
-
対象システム・サービス名:〔例:決済APIサービス / 認証基盤 / データパイプライン〕
-
インフラ・技術スタック:〔例:AWS ECS / Kubernetes (EKS) / RDS PostgreSQL / Datadog〕
-
手順の概要(メモ・箇条書きで可):
〔例:CPUアラート発報 → ログ確認 → スケールアウト → 原因調査 → 報告〕 -
影響範囲・重要度:〔例:全ユーザーに影響 / 一部機能のみ / バックグラウンド処理のみ〕
-
SLO / SLA:〔例:可用性99.9% / RTO 30分以内 / RPO 1時間以内〕
-
エスカレーション先:
フェーズ 担当 連絡手段 一次対応 〔例:オンコール担当〕 〔例:PagerDuty〕 二次対応 〔例:SREリード〕 〔例:Slack #incidents〕 経営報告 〔例:VP of Engineering〕 〔例:電話〕 -
既知の関連インシデント・前例(任意):
〔過去の類似障害・対応履歴のメモ〕
作成内容
1. 概要セクション
- 目的・適用範囲・前提条件
- 想定所要時間・難易度・必要な権限
2. 前提チェックリスト
- 実行前に確認すべき事項(権限・依存サービスの状態など)
3. 手順(ステップバイステップ)
各ステップに以下を含める:
- コマンド・操作(コードブロック付き)
- 期待される出力・確認ポイント
- 異常時の分岐(
→ 正常の場合:次のステップへ/→ 異常の場合:手順Xへ) - 推定所要時間
4. 検証・確認手順
- 対応完了を確認するためのチェック項目
- 監視ダッシュボード・メトリクスの確認方法
5. ロールバック手順
- 対応を元に戻す必要が生じた場合の手順
6. インシデントレポート記載項目
- 発生日時・検知方法・影響範囲
- タイムライン(検知 → 対応開始 → 解消)
- 根本原因(RCA)・再発防止策
7. 関連リンク
- ダッシュボード・ログ・アーキテクチャ図・過去インシデントへのリンクプレースホルダー
作成ルール
- コマンドは実際にコピー&ペーストして使えるよう、コードブロックに入れること
- 変数・環境依存部分は
${VARIABLE_NAME}形式でプレースホルダーを示すこと - 判断が必要な箇所には「⚠️ 注意」「✅ 確認」などの視覚的マーカーを付けること
- 手順は誰でも(深夜のオンコール担当でも)迷わず実行できる粒度で書くこと
出力形式
Markdown形式で出力してください。 Confluenceへの貼り付けやGitHub上での管理を想定した構成にしてください。
💡 ヒント
💡 使い方
上のテンプレートをコピーして Claude Coworkに貼り付け、
〔〕で囲まれた箇所をご自身の情報に書き換えてお使いください。