Amazon telah mengungkapkan temuannya menjadi penyebab pemadaman AWS baru-baru ini yang memengaruhi situs web dan pengguna di seluruh dunia.
Berbagai layanan Amazon seperti Prime Video, Alexa, dan Ring, bersama dengan pelanggan tingkat tinggi seperti Facebook dan Disney Plus, semuanya mengalami waktu henti atau pelambatan signifikan karena masalah di wilayah AWS AS yang berlangsung berjam-jam.
Perusahaan sekarang telah menyelesaikan penyelidikannya atas pemadaman tersebut, yang dikatakan turun ke serangkaian peristiwa tak terduga yang awalnya ditujukan untuk meningkatkan layanannya.
pemadaman AWS
“Aktivitas otomatis untuk menskalakan kapasitas salah satu layanan AWS yang dihosting di jaringan AWS utama memicu perilaku tak terduga dari sejumlah besar klien di dalam jaringan internal,” tulis AWS dalam postingan blog (terbuka di tab baru).
“Hal ini mengakibatkan lonjakan besar aktivitas koneksi yang membuat perangkat jaringan antara jaringan internal dan jaringan AWS utama kewalahan, mengakibatkan keterlambatan komunikasi antara jaringan ini.”
Perusahaan mengatakan sekarang telah mengambil “beberapa tindakan” untuk mencegah terulangnya peristiwa ini, termasuk evaluasi lebih lanjut dari aktivitas penskalaan tersebut dan menerapkan konfigurasi jaringan tambahan.
AWS juga telah berjanji untuk merombak cara melacak dan memberikan informasi tentang pemadaman (terbuka di tab baru) ke depan, mencatat bahwa, “Kami memahami bahwa peristiwa seperti ini lebih berdampak dan membuat frustrasi ketika informasi tentang apa yang terjadi tidak tersedia.”
Perusahaan mengatakan sekarang akan menyebarkan “beberapa peningkatan” ke Layanan Dukungannya untuk memastikannya dapat dengan cepat mengomunikasikan masalah apa pun di masa depan dengan pelanggan, dengan peningkatan yang ditetapkan untuk diterapkan pada awal 2022.
“Akhirnya, kami ingin meminta maaf atas dampak yang ditimbulkan oleh acara ini bagi pelanggan kami,” tutup blog tersebut. “Sementara kami bangga dengan rekam jejak ketersediaan kami, kami tahu betapa pentingnya layanan kami bagi pelanggan kami, aplikasi dan pengguna akhir mereka, serta bisnis mereka. Kami tahu peristiwa ini memengaruhi banyak pelanggan secara signifikan. Kami akan melakukan semua yang kami bisa untuk belajar dari acara ini dan menggunakannya untuk meningkatkan ketersediaan kami lebih jauh.”