Следите за новостями по этой теме!
Подписаться на «Рифы и пачки / Твоя культура»
Cloudflare, крупная компания, предоставляющая сервисы для защиты веб-сайтов и ускорения их работы, оказалась в центре внимания 18 ноября, когда произошёл массовый сбой, который вывел из строя множество сайтов по всему миру. Сначала в самой компании предположили, что причиной сбоя стала DDoS-атака — это когда злоумышленники направляют огромный объём трафика на сайт или сервис, чтобы вывести его из строя. Однако позже генеральный директор Cloudflare Мэттью Принс признал: тревога оказалась ложной.
В своём блоге Принс подробно разобрал произошедшее и объяснил, что инцидент был вызван не хакерами и не злонамеренными действиями, а ошибкой при изменении разрешений в системах баз данных Cloudflare. Это изменение затронуло специальный файл, используемый их системой управления ботами (Bot Management).
Система управления ботами в Cloudflare использует алгоритмы машинного обучения для оценки — так называемые "бот-оценки" — которые определяют, является ли запрос на сайт автоматическим. Клиенты Cloudflare используют эти оценки, чтобы разрешать или блокировать ботов. Главная идея — дать сайтам возможность, например, запрещать ботам компаний по искусственному интеллекту (AI) использовать их содержимое для обучения своих языковых моделей. Cloudflare даже запускала с лета экспериментальный сервис "оплата за индексирование": владельцы сайтов могли разрешать или запрещать посещать свои страницы AI-ботам за деньги.
Ключ к сбою — файл конфигурации, от которого зависела работа бот-системы. Этот файл обновляется каждые несколько минут. Но когда поменялась сама система, генерирующая файл, изменилась и его структура и размер. Это и привело к критической ошибке: "ядро проксирования", то есть система, обрабатывающая основной трафик Cloudflare, стало возвращать клиентам коды ошибок HTTP 5xx. Фактически любой сайт, который зависел от работы бот-модуля, оказался недоступен.
По словам Принса, это самая серьёзная авария Cloudflare за несколько последних лет — похожих сбоев не было с 2019 года, когда был парализован основной трафик всей сети. Руководство компании принесло официальные извинения за инцидент.
Cloudflare снова показывает класс: массовый сбой и паралич сотен сайтов, но хакеры ни при чём. Подозрение на DDoS-атаку — классическое прикрытие, когда никто не хочет признаться: все сломал человек, нажав не туда. Бдительный Мэттью Принс пару часов делал вид, что коварные враги ломятся в цитадель добра, а оказалось — файлик системы управления ботами тихо обновился, да ещё неправильного размера. Система пугается своего отражения и блокирует собственных клиентов.
Фарс с "оплатой за индексацию" для AI-ботов тоже всплыл — смешная попытка вписать коммерцию в хаос. В итоге Cloudflare извиняется, рассказывает сказки про уникальность сбоя (такого, мол, с 2019 не было!), а клиенты тянут сайты из руин. Почему-то ни один CTO не пишет: "Спасибо, что живы". Но на рынке CDN всё как всегда — сломали сами, починили сами, миф о киберугрозе поддержали до последнего. Сценарий идеальный: шум, паника, разоблачение и извинения. Мешаешься только здравый смысл.