Cloudflare Error, CEO Ungkap Biang Kerok hingga Potensi Kerugian

Cloudflare Error, CEO Ungkap Biang Kerok hingga Potensi Kerugian

Bisnis.com, JAKARTA — Cloudflare, penyedia layanan keamanan dan CDN terkemuka, mengalami outage atau gangguan secara masif pada Selasa (18/11/2025) yang mengganggu layanan internet global, termasuk situs-situs besar seperti X.com. 

CEO Cloudflare Matthew Prince mengakui bahwa penyebabnya adalah perubahan izin pada sistem database, yang awalnya disangka sebagai serangan DDoS berskala hiper.

Perubahan tersebut menyebabkan database mengeluarkan entri ganda ke dalam “feature file” yang digunakan oleh sistem Bot Management Cloudflare. File ini, yang mendeskripsikan aktivitas bot berbahaya dan didistribusikan ke infrastruktur routing, membengkak dua kali lipat melebihi batas ukuran yang ditetapkan, sehingga memicu kegagalan perangkat lunak menurut laporan Register.

Insiden dimulai sekitar pukul 11:20 UTC, saat Cloudflare sedang memperbarui manajemen izin pada klaster database ClickHouse yang menghasilkan versi baru feature file setiap lima menit.

Perubahan izin dimaksudkan untuk memberikan akses ke data dan metadata underlying, tetapi query yang salah mengembalikan informasi ekstra, sehingga file membengkak.

Data buruk hanya dihasilkan jika query berjalan pada bagian klaster yang telah diperbarui, menyebabkan propagasi file baik dan buruk secara bergantian. Hal ini menciptakan fluktuasi: sistem pulih sementara lalu gagal lagi, membuat tim Cloudflare awalnya menduga serangan DDoS hiper-skala.

Sekitar pukul 13:00 UTC, kondisi makin tidak stabil, menyebabkan outage persisten bagi pelanggan. Dampaknya mencakup kesalahan HTTP 5xx, peningkatan latensi pada CDN, serta gangguan pada layanan seperti Workers KV, Cloudflare Access, dan Dashboard, yang mengandalkan proxy inti.

Cloudflare akhirnya mengidentifikasi sumber masalah dan menghentikan generasi serta propagasi file buruk pada pukul 14:24 UTC. Mereka secara manual memasukkan file baik ke antrian distribusi dan memaksa restart proxy inti untuk membaca hanya file yang valid.

Trafik kembali normal sekitar pukul 14:30 UTC, meski ada masalah downstream pada sistem dependen.

Prince meminta maaf atas insiden yang disebutnya “tidak dapat diterima”, menekankan bahwa outage seperti ini adalah yang terburuk sejak 2019.

Perusahaan berencana melakukan empat langkah perbaikan: memperkuat ingest file konfigurasi seperti input pengguna, mengaktifkan lebih banyak kill switch global, menghilangkan kemampuan core dumps membanjiri sumber daya, dan meninjau mode kegagalan pada modul proxy inti.

Sementara itu, kerugian akibat outage besar Cloudflare diperkirakan mencapai miliaran dolar AS secara global.

Menurut analisis industri dan sejumlah sumber, potensi kerugian ekonomi akibat gangguan ini diperkirakan antara US$5 miliar hingga US$15 miliar per jam outage, karena Cloudflare melayani ribuan perusahaan besar dan situs kritikal di seluruh dunia menurut laporan Tom’sguide.

Outage ini berlangsung sekitar 4 jam, sehingga estimasi total kerugian bisa mencapai US$20 miliar – US$60 miliar. Selain itu, Cloudflare sendiri mengalami penurunan kapitalisasi pasar sekitar 1,8 miliar dolar AS akibat anjloknya harga saham sampai 3,9 persen setelah insiden ini.

Di tingkat pelanggan, bisnis berskala menengah hingga besar—yang sangat bergantung pada layanan cloud—umumnya menderita kehilangan rata-rata US$300.000 per jam, dan hampir setengah dari perusahaan besar melaporkan kerugian lebih dari US$1 juta per jam selama downtime.