Gangguan Internet Global! Cloudflare Sebut File Terlalu Besar

Erlita Irmania
0
Gangguan Internet Global! Cloudflare Sebut File Terlalu Besar

Gangguan Global yang Mengguncang Internet

Pada Selasa, 18 November 2025, jutaan pengguna internet di seluruh dunia mengalami gangguan layanan yang signifikan. Situs web yang biasanya dapat diakses dengan mudah tiba-tiba tidak bisa dibuka dan hanya menampilkan ikon loading. Aplikasi musik seperti Spotify, layanan AI seperti ChatGPT, hingga platform media sosial milik para pejabat juga terganggu. Kejadian ini menjadi peringatan bahwa jaringan internet modern sangat rentan terhadap kegagalan sistem.

Di balik layar, penyebab utama kegagalan adalah perubahan konfigurasi kecil dari Cloudflare—perusahaan infrastruktur web terbesar yang melayani sebagian besar lalu lintas internet. Dalam hitungan menit, gangguan ini menyebabkan efek domino yang memengaruhi jutaan pengguna. Perusahaan ini merilis pernyataan resmi di blognya, menjelaskan bahwa kegagalan terjadi karena masalah teknis dalam pengiriman lalu lintas inti. Pengguna internet mengalami halaman kesalahan yang menunjukkan adanya gangguan pada jaringan Cloudflare.

Bukan Serangan Siber, Tapi Kesalahan Konfigurasi

Menurut pernyataan Cloudflare, gangguan bukan disebabkan oleh serangan siber atau sabotase. Sebaliknya, kegagalan terjadi akibat sebuah berkas konfigurasi yang "tumbuh lebih besar dari seharusnya." Kesalahan kecil ini memicu bug yang membuat sistem penanganan lalu lintas lumpuh secara mendadak. Dane Knecht, CTO Cloudflare, mengungkapkan bahwa pembaruan rutin menyebabkan crash yang kemudian merembet ke jaringan dan layanan lain. Ia menyampaikan permintaan maaf atas dampak yang terjadi dan berkomitmen untuk memastikan hal ini tidak terulang.

Cloudflare bukan satu-satunya yang mengalami gangguan belakangan ini. Sebulan sebelumnya, Amazon Web Services (AWS) juga mengalami masalah yang membuat jutaan pengguna tidak bisa memesan kopi, membuka aplikasi rumah pintar, atau mengakses layanan perusahaan. Bug sederhana—dua sistem otomatis memodifikasi data secara bersamaan—berujung pada kegagalan global. Beberapa hari setelahnya, Microsoft Azure pun mengalami nasib serupa.

Ketergantungan Pada Platform Digital

Para ahli menyatakan bahwa dunia saat ini semakin bergantung pada platform digital. Tulang punggung internet dikuasai oleh segelintir raksasa. Ketika salah satu dari mereka tergelincir, dampaknya langsung dirasakan oleh jutaan orang. Eileen Haggerty dari Netscout menyebut gangguan seperti ini sebagai "amat umum," meskipun terjadi pada perusahaan dengan teknologi terbaik. Mike Chapple, profesor TI di University of Notre Dame, menambahkan bahwa kegagalan kecil adalah keseharian di masa lalu, tetapi sekarang seluruh dunia bertumpu pada penyedia yang sama; ketika satu pilar goyah, seluruh gedung ikut berderak.

Data dari Downdetector menunjukkan bahwa lebih dari 2,1 juta laporan kegagalan layanan masuk dalam satu hari. Cloudflare sendiri menangani rata-rata 81 juta permintaan HTTP setiap detik—volume yang membuat kerusakan terkecil pun menyentuh skala global. Cisco ThousandEyes mencatat ada 12 gangguan besar sepanjang 2025, tak jauh berbeda dari tahun-tahun sebelumnya. Jumlahnya mungkin tidak melonjak, tetapi dampaknya terasa lebih luas karena semakin banyak aplikasi, perusahaan, dan rumah tangga yang terkoneksi dan saling bertaut.

Penyebab Spesifik dari Gangguan Cloudflare

Cloudflare menjelaskan bahwa halaman kesalahan HTTP ditampilkan selama insiden. Masalah ini tidak disebabkan oleh serangan siber atau aktivitas berbahaya apa pun. Sebaliknya, masalah dipicu oleh perubahan pada salah satu izin sistem basis data yang menyebabkan basis data mengeluarkan beberapa entri ke dalam "file fitur" yang digunakan oleh sistem Manajemen Bot kami. File fitur tersebut kemudian menjadi dua kali lipat ukurannya.

Perangkat lunak yang berjalan pada mesin-mesin ini untuk merutekan lalu lintas di jaringan kami membaca berkas fitur ini agar sistem Manajemen Bot kami selalu terbarui dengan ancaman yang terus berubah. Perangkat lunak tersebut memiliki batasan ukuran berkas fitur yang kurang dari dua kali lipat ukurannya. Hal ini menyebabkan perangkat lunak tersebut gagal.

Setelah awalnya mereka salah menduga gejala yang dilihat disebabkan oleh serangan DDoS skala besar, mereka dengan tepat mengidentifikasi masalah inti dan dapat menghentikan penyebaran berkas fitur yang lebih besar dari perkiraan tersebut serta menggantinya dengan versi berkas yang lebih lama.

Akhirnya, Semua Organisasi Rentan

Cloudflare menyatakan bahwa volume sebelum pukul 11:20 adalah nilai dasar yang diharapkan untuk kesalahan 5xx yang diamati di seluruh jaringan mereka. Lonjakan dan fluktuasi selanjutnya menunjukkan sistem mereka gagal karena memuat berkas fitur yang salah. Yang perlu diperhatikan adalah sistem mereka kemudian akan pulih untuk sementara waktu. Ini adalah perilaku yang sangat tidak biasa untuk sebuah kesalahan internal.

Penjelasannya adalah bahwa berkas tersebut dihasilkan setiap lima menit oleh kueri yang berjalan di kluster basis data ClickHouse, yang diperbarui secara bertahap untuk meningkatkan manajemen izin. Data buruk hanya dihasilkan jika kueri dijalankan pada bagian kluster yang telah diperbarui. Akibatnya, setiap lima menit ada kemungkinan kumpulan berkas konfigurasi yang baik atau buruk dihasilkan dan disebarkan dengan cepat ke seluruh jaringan.

Fluktuasi ini membuat Cloudflare tidak memahami jelas apa yang terjadi karena seluruh sistem akan pulih dan kemudian gagal lagi karena terkadang berkas konfigurasi yang baik, terkadang buruk didistribusikan ke jaringan kami. Awalnya, hal ini membuat mereka percaya bahwa ini mungkin disebabkan oleh serangan. Akhirnya, setiap node ClickHouse menghasilkan berkas konfigurasi yang buruk dan fluktuasi stabil dalam status gagal.

Kesalahan berlanjut hingga masalah yang mendasarinya diidentifikasi dan diselesaikan mulai pukul 14:30. Kami memecahkan masalah dengan menghentikan pembuatan dan penyebaran berkas fitur yang buruk dan secara manual memasukkan berkas yang diketahui baik ke dalam antrean distribusi berkas fitur. Kemudian, memaksa restart proksi inti kami.

Kesimpulan

Seperti dikatakan Haggerty, tidak ada perusahaan yang kebal. “Ini bukan hal yang bisa kita bilang, ‘Syukurlah itu tidak akan terjadi pada kami,’” ujarnya. “Semua organisasi rentan mengalaminya.” Di tengah dunia yang semakin bergantung pada internet untuk urusan paling sederhana sekalipun, gangguan demi gangguan ini menjadi pengingat bahwa teknologi—betapapun canggihnya—tetap rapuh. Dan saat satu benang terputus dari jaring raksasa bernama internet, kita semua bisa merasa tersesat di ruang sunyi yang tak terduga.

Posting Komentar

0 Komentar

Posting Komentar (0)
3/related/default