ホームニューステックニュースApplication Signalsでバーンレートアラームを学ぶ #AWS - Qiita

Application Signalsでバーンレートアラームを学ぶ #AWS – Qiita

2025年5月7日

2

Application Signalsでバーンレートアラームを学ぶ #AWS - Qiita

　先月開催されたAWS 春のObservability祭り 2025に参加しました。Observabilityに関するAWSのサービスについて学ぶことができる、とても良いイベントでした。おおよそ半年おきに開催されており、私は3回目の参加でした。

<br />

　多数のLTの中でSenior Developer Advocateの山口さんからバーンレートアラームについての解説がありました。解説を聞いて、私自身は旧来の監視（固定しきい値、メッセージ監視）の経験しかないため、今後の運用を考えるとSLI、SLO、エラーバジェット、バーンレートアラームといったキーワードについてしっかりと理解したいと思いました。Application Signalsの設定で簡単に始められるというお話だったので、実際に手を動かしながら学ぶことにしました。
　Observability初学者のため、AWSの以下ドキュメントを読みながら進めてきましたが、解釈に誤りや認識齟齬があればご指摘いただけると幸いです。

<br />

　シンプルなAPIGateway、Lambda、DynamoDBの構成をCDKでデプロイして利用しました。イメージは以下の形となります。

Lambda関数に対してApplication SignalsとX-Rayを有効化しました。
設定→モニタリングおよび運用ツール→その他の監視ツールの編集から遷移できます。

今回取り扱うキーワードについて、私なりの解釈です。

キーワード	私の理解
SLI	サービス品質をOKと判断する指標（例：総リクエストに対するレイテンシーが1秒以下のリクエストをOKとする）
SLO	どの程度SLIを守れたら、OKとするかの指標（例：過去30日間のリクエストのうち、99%以上がSLIを満たしていること）
エラーバジェット	どれくらい失敗が許容できるかの指標。（例：過去30日間のリクエストのうち、最大1%まではSLIを超えてもOK(予算を使ってもOK)）
バーンレート	エラーバジェットがどれくらいの速さで消費されているかの指標（例：このままのエラー発生ペースが続いた場合、SLOが守れるか判断するための数値）
ルックバックウィンドウ	SLOの達成率やバーンレートの消費量を評価するために、過去どれだけの期間を元に計算するかという指標（例：60分の期間内の実績を元にSLI、SLOを評価）