2022年06月21日の昼頃、CloudFlareの大規模障害が発生し、多くのWebサービ スが影響を受けた。このサイトの前段にもCloudFlareを利用しているので、漏 れなくInternal Server Errorを表示する状況になっていた。今回はこの事に ついてまとめる。

障害の経緯

UTC JST 出来事
03:56 12:56 問題の変更を最初の場所にデプロイした。ただし現時点では古いアーキテクチャを使用しているため影響は発生しなかった。
06:17 15:17 問題の変更を稼動率の最も高い場所にデプロイした。ただし、MCPアーキテクチャの場所にはまだデプロイされていないため影響は発生しなかった。
06:27 15:27 問題の変更をMCP対応の場所であるspainにデプロイする。この時点でインシデントが発生し、19の場所がすぐさまオフラインになった。
06:32 15:32 Cloudflare社内でインシデントを宣言する。
06:51 15:51 原因の特定のための最初のルーターの変更を行った。
06:56 15:56 問題が発生している旨のアナウンスが流れる。
06:58 15:58 根本原因を特定し、復旧作業を開始した。
07:16 16:16 問題を特定し、実装している旨のアナウンスが流れる。
07:42 16:42 復旧作業を完了した。ネットワークエンジニアが互いの変更を検討し、以前の復帰を元に戻し、問題が散発的に再発する原因となったため、遅延した。
07:46 16:46 修正され状態を監視している旨のアナウンスが流れる。
08:00 17:00 インシデントが解消された。

詳しくはCloudFlareの公式blogで言及されている1

CloudFlareのインシデントレポート

自分への影響

影響自体は世界的に出たようだが、それはCloudFlareの人が考えることだから、 ここではそれは取り上げない。自分自身に起きた影響のうち、公開できるもの だけを記載する。

現在管理しているサイトは3つだが、それぞれに利用状況が異なる。

サイト 利用状況
www.symdon.info プロキシあり、ホスティングはGithub Pages
blog.symdon.info プロキシあり、ホスティングはNetlify
3beakers.symdon.info DNSのみ、ホスティングはVercel

今回影響があったもんものはCloudFlareでリクエストを受けてプロキシしてい たwww.symdon.infoとblog.symdon.infoについて、Internal Server Errorを表 示するようになっていた。

対策案

DNSの設定を編集し、CloudFlareを通さないように設定変更できれば、被害を 防げた。しかし残念ながら、そこまでの時間もなかった。

実施状況

TBD

脚注

出典