Le 10 septembre dernier, Go Daddy a connu une panne massive qui a laissé des milliers de clients sans leurs sites Web. Il y a eu beaucoup de spéculations quant à la manière dont les problèmes ont été causés, mais le DPI de Go Daddy a maintenant rompu le silence de l’entreprise dans un article de blog détaillé de plus de 1500 mots.
Le Dirigeant principal de l’information de GoDaddy Auguste Goldman a révélé que les problèmes ont été causés par une « tempête parfaite » de défaillances qui se sont réunies pour provoquer des pannes de réseau. L’idée que l’entreprise ait été piraté, découlant de la revendication d’un membre du groupe Anonymous, a été rejetée d’emblée dans l’article.
L’article décrit Go Daddy comme une entreprise qui reçoit une moyenne de 10 milliards de requêtes DNS différents sur une base quotidienne à travers 41 millions zones DNS différentes. Ces requêtes DNS sont poussés à travers le système anycast de routage BGP de l’entreprise. Il est conçu pour réduire la latence si l’un des matériels échoue, mais ce jour-là l’incident a poussé les routeurs au-delà de leurs limites normales.
Goldman a simplifié les problèmes en énonçant les trois différents facteurs contribuant à les créer. Ces problèmes étaient des modes de défaillance matérielle des routeurs, l’épuisement de la mémoire des routeurs et du confinement. En quelques minutes, une réaction en chaîne avait été causé par la défaillance du matériel de routage, ce qui a conduit à des pannes massives partout dans le système.
Go Daddy a restauré ses services par le biais de filtrage des informations de routage et la restauration de la table de routage, ainsi que par un redémarrage complet des routeurs qui éprouvaient de la difficulté à suivre. La principale difficulté, selon Goldman, était de faire face au trafic DNS écoulé toujours sur le réseau.
Goldman a déclaré que le raisonnement derièrre le dévoilement des problèmes était pour atteindre son objectif d’assurer la transparence et détailler les éléments spécifiques qu’ils ont mis en place pour prévenir un autre incident comme celui-ci.
Ce qui reste à voir pour Go Daddy c’est si ces problèmes auront un impact sur l’image de l’entreprise d’hébergement à l’avenir.