19 พ.ย. เวลา 07:57 • วิทยาศาสตร์ & เทคโนโลยี

Cloudflare เปิดเผยสาเหตุระบบล่มครั้งใหญ่ที่สุดในรอบ 6 ปี

โดย
Cloudflare ได้เผยรายงานสรุปสาเหตุเหตุการณ์ระบบล่มครั้งใหญ่ทั่วโลกเมื่อคืนที่ผ่านมา ซึ่งเกิดขึ้นเวลา 11:20 UTC (18:20 น. ตามเวลาไทย) โดยระบุว่าเป็นเหตุขัดข้องร้ายแรงที่สุดในรอบ 6 ปี
  • ​สาเหตุและลำดับเหตุการณ์
1) สาเหตุหลัก
- บั๊กในระบบสร้างคอนฟิก ทำให้สร้างข้อมูลซ้ำๆ จนไฟล์มีขนาดใหญ่เกิน
- การปรับสิทธิ์ใน ClickHouse 15 นาทีก่อนเกิดเหตุ อนุญาตให้ query ข้อมูลภายในคลัสเตอร์ได้โดยตรง
- เมื่อ query ตาราง system โดยไม่ระบุฐานข้อมูล ทำให้ได้ข้อมูลซ้ำกันจำนวนมาก
2) ผลกระทบลูกโซ่
- Bot Management รับข้อมูลเกิน limit ที่กำหนด (จากปกติ 60 บรรทัด เป็นเกิน 200 บรรทัด)
- FL2 (proxy) เกิดการ crash
- ผลกระทบลามไปยังบริการอื่น
○ CDN
○ Turnstile
○ Cloudflare Access
○ Dashboard
3) การแก้ไขล่าช้า
- ทีมงานเข้าใจผิดคิดว่าเป็นการโจมตีแบบ DDoS
- ใช้เวลาระบุสาเหตุที่แท้จริงนานกว่าปกติ
  • ​การตอบสนองของ Cloudflare
- ปรับระบบอ่านคอนฟิกจากภายในให้ตรวจสอบแบบเดียวกับการรับคอนฟิกจากภายนอก
- Matthew Prince (CTO) ขอโทษผู้ใช้อย่างเป็นทางการ
✏️ Shoper Gamer
Credit :
👇
  • ​https://www.blognone.com/node/148941
โฆษณา