En une journée, l’Internet mondial a été plongé dans le chaos en raison d’une panne majeure de Cloudflare, alimentant les spéculations sur une possible cyberattaque. Cependant, les causes réelles de cet incident, qui a paralysé le réseau pendant plus de six heures, sont bien plus techniques qu’il n’y paraît. Plongeons dans les détails de cet événement sans précédent.
L’essentiel à retenir
Le 18 novembre 2025, Cloudflare a déployé une modification sur un cluster de bases de données ClickHouse, visant à renforcer la sécurité des accès. Cependant, cette mise à jour a généré un effet de bord imprévu : chaque colonne de données a commencé à apparaître en double, provoquant une explosion du nombre d’empreintes dans le fichier Bot Management, passant de soixante à plus de deux cents.
Ce fichier étant crucial pour la détection des bots, son gonflement a causé une surcharge des serveurs, entraînant des erreurs 500 à travers le réseau mondial.
Avec des milliers de serveurs touchés, l’impact a été dévastateur. Les sites utilisant le CDN de Cloudflare ont affiché des erreurs, le système Turnstile est devenu inaccessible et le service Workers KV a connu des interruptions. Même le tableau de bord Cloudflare a été affecté, rendant impossible l’accès à la page de connexion en raison de sa dépendance à Turnstile.
Cloudflare Access, un service crucial pour l’authentification des entreprises, a été particulièrement touché, bloquant les connexions entre 12h28 et 14h05.
Matthew Prince, reconnaissant l’erreur de diagnostic initiale, a promis des changements structurels majeurs. Désormais, les fichiers de configuration interne bénéficieront d’une validation stricte avant déploiement, et des coupe-circuits seront mis en place pour désactiver rapidement une fonctionnalité défaillante.
Par ailleurs, les rapports de débogage, qui ont aggravé la situation en consommant des ressources processeur, seront plafonnés pour éviter de ralentir le traitement des requêtes légitimes.
Fondée en 2009, Cloudflare s’est imposée comme un acteur incontournable de l’Internet, offrant des services de sécurité et de performance à plus de 20% des sites web mondiaux. L’entreprise a déjà connu des incidents majeurs, notamment en 2019 avec une mise à jour de pare-feu mal testée, mais la panne récente souligne les défis de la gestion d’une infrastructure aussi complexe. Cloudflare continue d’évoluer pour répondre aux exigences croissantes de sécurité et de performance dans un paysage numérique en constante mutation.