読者です 読者をやめる 読者になる 読者になる

IT Notebook

ITについての備忘録的なブログです

Pagerduty事始め - Pagerdutyとは

Pagerdutyについて調査・検証したので、これから纏めていこうと思います

Pagerdutyとは

  • 監視システムからのアラートをインシデントとして管理する「インシデントマネジメントシステム」

www.pagerduty.com

Pagerdutyのイメージ

  • 監視システム(AWSのCloudWatchやZabbixなど)からアラートをPagerdutyに連携すると、Pagerdutyで「Incidents」として登録される
  • Pagerdutyは「Teams」「Escalation Policies」「Schedules」の設定により登録された担当者に「Incidents」を割り当てる
  • 割り当てられた担当者は「Urgency」に基づき「Notification」を受け取る
  • 担当者は割り当てられた「Incidents」を確認したら「Status」を「Acknowlged」に更新する
  • 担当者は対応が完了したら「Status」を「Resolved」に更新する

Webコンソールの各項目について

Incidents

  • アラートに対して生成されるもので、そのアラートのステータスを管理する

Teams

  • 組織によって単位はことなるが、プロジェクトもしくはシステム別に対応する担当者
  • 複数登録することにより「Escalation Policies」によりエスカレーションすることができる

Escalation Policies

  • エスカレーションする順序・間隔などを登録することができる
  • 「Schedules」を登録することにより担当者が対応可能な時間のみエスカレーションすることができる

Schedules

  • 担当者が対応可能な時間を登録

Urgency

  • high/lowのアラートレベルによって通知を受けるNotification Ruleを設定できる

Notification

  • 以下のものについて、担当者単位の通知ができる

    • Phone
    • SMS
    • Email
    • 専用アプリのPush Notification
  • その他サービス単位ではAPIにより「Hipchat」「Slack」などに連携できる

つぎはユーザ作成について纏めようと思います