Украинские эксперты прокомментировали глобальный сбой Facebook
Facebook. Фото - Pixabay

Вечером 4 октября сотни миллионов людей по всему миру не знали, чем заняться в транспорте или во время перекура – Facebook, Instagram и мессенджер WhatsApp не работали.

Глобальный сбой продолжался более шести часов; пользователи не могли обновить ленту новостей и зайти в свои аккаунты. Глава Facebook Марк Цукерберг уже извинился перед пользователями соцсетей компании и WhatsApp. Из-за сбоя его состояние уменьшилось почти на $7 миллиардов.

Facebook в своем официальном блоге сообщил, что шестичасовое отключение, которое привело к глобальному сбою в Facebook, Instagram и WhatsApp, было результатом "изменения конфигурации магистральных маршрутизаторов, которые координируют сетевой трафик между нашими центрами обработки данных", а не взлома или попытки получить пользовательские данные. Каких-то технических подробностей нам не сообщают, но, похоже, что серверы Facebook не смогли общаться друг с другом. В Facebook утверждают, что "это нарушение сетевого трафика обусловило каскадное влияние на способы связи наших центров обработки данных, в результате чего наши сервисы перестали работать".

Мы поговорили с украинскими экспертами, которые подробно объяснили, что могло произойти с Facebook и Instagram.

"Точную причину никто не знает, но выглядит это как сбой сети. Когда у вас большая сеть, вы создаете инструмент централизованного управления ею. И выходит, что управляете сетью с помощью сети, используя ее для передачи команд. Есть такой тип ошибок, в результате которых эта сеть падает. Исправить эту ошибку может быть очень легко и просто, но для этого нужно передать команду на удаленное устройство, а без сети это невозможно. Похоже на то, что Facebook столкнулся именно с такой ошибкой, – рассказал президент холдинга Internet Invest Group, один из "отцов-основателей" украинского интернета Александр Ольшанский. – Чем сложнее сеть, тем опаснее ошибка. Обычно мы все ответственные устройства в своих сетях снабжаем альтернативным каналом связи, например, 4G-модемом".

И тогда, даже если у вас все развалилось, через этот тоненький канал вы можете добраться до ошибки и исправить ее. А Facebook пришлось отправлять сотрудников, чтобы вручную добраться до серверов. Это очень непростая история, когда у вас тысячи устройств и вы привыкли управлять ими удаленно. А потом вам нужно поехать в 20 или 50 мест и исправить ошибку, учитывая, что там важна последовательность – что раньше, что позже. На самом деле сетевым специалистам известны такие случаи, и они страхуются. Видимо, в Facebook сделали что-то не так. Обычно после подобной аварии проходит работа над ошибками, на которую уйдут недели. При такой серьезной аварии сложно выявить первопричины".

О возможной ошибке, которая привела к сбою Facebook, рассказал Антон Яковлев, эксперт, работающий в области сетевой инженерии и коммуникаций более 10 лет.

"Весь мировой интернет работает благодаря возможности превращения понятных для пользователя доменных имен вроде www.facebook.com в ip-адреса, "понятные" технике. Они выглядят, например, как 157.240.224.35. За эту трансформацию отвечают корневые DNS-сервера (Domain Name System – система доменных имен), обеспечивающие работу в масштабах всего мира. Частные компании, такие как Facebook, могут устанавливать собственные DNS-сервера или маршрутизаторы, которые ускорят доступ пользователей к ресурсам этих компаний, сбалансируют нагрузки и будут управлять потоками клиентов", – рассказал Антон.

В официальном блоге Facebook сообщили, что сбой случился из-за того, что изменилась конфигурация магистральных маршрутизаторов, координирующих сетевой трафик между центрами обработки данных. То есть маршрутизаторы перестали выполнять свою работу – в том числе превращать доменные имена в IP-адреса, и вся система легла. Сообщалось, что сотрудники Facebook не могли попасть в офис, потому что у них не работали электронные пропуски. Это произошло из-за того, что система безопасности компании, скорее всего, работает на хосте с условным доменом 123.security.facebook.com и при таком глобальном сбое доменное имя просто не могло быть обработано DNS-инфраструктурой Facebook.