インシデント対応を 10 倍速くする方法、教えます – PagerDuty と AWS で爆速障害対応 #AWSSummit

どうもさいちゃんです。2024 年 6 月 20 日、21 日に行われた AWS Summit Japan 2024 に参加し様々なセッションを視聴してきました。本記事は、「インシデント対応を 10 倍速くする方法、教えます – PagerDuty と AWS で爆速障害対応」というセッションにつてのレポートブログとなります。  登壇者とセッション概要 登壇者 草間 一人 氏 PagerDuty 株式会社 プロダクトエバンジェリスト セッション概要 クラウドシフトによって企業のシステム運⽤は⼤きく変わりました。ハードウェアの運⽤や障害対応から解放された⽅は多いでしょう。ですが、クラウドはクラウドで独⾃の運⽤体制が必要です。クラウドによって潤沢なリソースが使えるようになり、運⽤するシステム数が数倍になった結果、以前より運⽤が⼤変になったという話もよく聞きます。DX の進む現代では、システムの安定運⽤は必要不可⽋です。本セッションでは、複雑かつ⼤規模なシステムにおいても、PagerDuty と AWS の組み合わせによってわずか数分でインシデント対応できるようにする⽅法をお話しします。 AWSSummit Japan セッション一覧 レポート 近年のインシデントマネジメントの傾向 近年インシデントマネジメントが脚光を浴びている インシデント対応や、インシデントマネジメントに関してのイベントが多数開催されている なぜ注目されているのか? サービスの重要性の高まり システムの複雑化、大規模化により、一つのシステムのダウンが他の会社やシステムにまで影響 インシデントが起こった際のインパクトが大きくなってきている 技術の選択肢が多くなってきているためトラブルが起きた際の対応も複雑化している どの様にインシデント管理を行っていますか? CloudWatch Alarmの利用や、Slack 通知等を行っているという組織も多いのではないか? アラートが出たことに気づいた複数人が、インシデントにそれぞれ対応するというような方法 深夜帯にインシデントが発生し、対応者が1人しかいなかった場合 複雑なシステムのインシデントに一人では対応しきれない or 時間がかかるといった問題も 上記のような課題を解決するには、インシデント対応をより体系的に行う必要がある 組織としての対
情報元サイト:「Developers.IO」
[ オリジナルサイトで見る ]

関連記事一覧

  • コメント ( 0 )

  • トラックバックは利用できません。

  1. この記事へのコメントはありません。