Categories
Tech News Tech Updates

Cloudflare重大障害の原因と影響

Cloudflare experienced a major outage caused by an internal flaw, impacting several major sites.

Cloudflare、重大障害の原因を公表

Cloudflare Reveals Cause of Major Outage**

Cloudflareは火曜日、システム障害に直面しました。
Cloudflare suffered a system crash on Tuesday.

大規模な停止が発生しました。
A massive outage followed.

X(旧Twitter)、ChatGPT、Canvaなどが影響を受けました。
Major sites such as X, ChatGPT, and Canva were impacted.

障害は約5時間続きました。
The outage lasted nearly five hours.

多くの訪問者はHTTP 500エラーを見ました。
Visitors saw only an HTTP 500 error.

CloudflareのCEO、マシュー・プリンス氏が原因を説明しました。
CEO Matthew Prince explained the cause.

外部攻撃ではありませんでした。
It was not caused by any cyberattack.

内部システムの欠陥が原因でした。
An internal system flaw triggered the issue.


Cloudflare CEOの説明

Cloudflare CEO’s Breakdown**

プリンス氏は今回の障害を「2019年以来最悪」と述べました。
Prince called it “Cloudflare’s worst outage since 2019.”

彼は謝罪し、詳細を公開しました。
He apologized and shared a detailed breakdown.

根本原因はデータベース権限の変更でした。
The root cause was a permissions change in a database system.

その結果、Bot Management用の“feature file”が異常に肥大化しました。
This created an oversized “feature file” used by the Bot Management system.

ファイルはネットワーク全体に配布されました。
The file was distributed across the network.

プロキシソフトが読み込みに失敗しました。
Proxy software failed to read it.

ファイルはClickHouseクラスター上のクエリから生成されました。
The faulty file came from a query on a ClickHouse cluster.

5分ごとに再生成されました。
It was regenerated every five minutes.

更新済みノードと未更新ノードが混在していました。
Some nodes were updated while others were not.

結果として、障害と復旧が交互に発生しました。
This caused alternating failure and recovery.

初期診断ではDDoS攻撃の可能性も疑われました。
Initial diagnostics suggested a possible DDoS attack.

調査後、チームは悪いファイルの配布を停止しました。
After investigation, the team halted propagation of the bad file.

良好なバージョンに戻し、プロキシを再起動しました。
They rolled back to a good version and restarted proxy services.

14:30 UTC(20:00 IST)頃にコアトラフィックが正常化しました。
Core traffic returned to normal around 14:30 UTC.

完全復旧は17:06 UTC(22:36 IST)に報告されました。
Full recovery was reported at 17:06 UTC.


広範囲な影響

Wide Service Impact**

CDNやセキュリティサービスでHTTP 5xxエラーが発生しました。
CDN and security services saw elevated 5xx errors.

Turnstileサービスは読み込みに失敗しました。
Turnstile bot-challenge service failed to load.

Workers KVは高いエラー率を記録しました。
Workers KV experienced high error levels.

ダッシュボードは動いていましたが、多くのユーザーがログインできませんでした。
The Dashboard was mostly operational, but many users could not log in.

メールセキュリティも精度低下が生じました。
Email security features suffered reduced accuracy.


CEOコメント

CEO’s Statement**

「今日のような障害は受け入れられません」とプリンス氏は述べました。
“An outage like today is unacceptable,” Prince said.

彼は、過去の障害がより強固なシステムの構築につながったと強調しました。
He emphasized that past outages have led to stronger systems.

Cloudflareは再発防止策を進めています。
Cloudflare is moving to prevent recurrence.

Leave a Reply

Discover more from CMP Tech World

Subscribe now to keep reading and get access to the full archive.

Continue reading