Synthèse de l’incident
08/07 22h04 : début de l’incident
08/07 22h10 : alertes trafic - ouverture de la cellule de crise
08/07 22h34 : compréhension que l’incident est causé par la maintenance d’un partenaire réseau externe et la défaillance du backup automatisé
08/07 22h50 : investigation en vue de la construction d’un lien réseau de secours
09/07 00h57 : reprise du service sur le lien réseau de secours
09/07 10h32 : tests réseaux OK, début des opérations pour revenir au lien réseau nominal
09/07 11h07 : retour à l'état nominal. Fin de l’incident
Root cause
En cours d’investigation.
Contexte
Maintenance d'un prestataire réseau avec lequel nous travaillons. Le système de backup automatisé mis en place avec ce prestataire n'a pas fonctionné. Nous sommes toujours en cours d'investigation avec le prestataire pour comprendre pourquoi la bascule ne s'est pas opérée automatiquement et les responsabilités.
Actions à entreprendre par Payplug
Symptome | Action |
---|---|
Lien de backup automatisé non fonctionnel | Monter un lien réseau de backup alternatif actionnable manuellement |
Détection de l’incident rapide via la perte trafic, mais compréhension de la root cause plus longue | Ajouter de la supervision pour détecter ce type de panne du backup principal |
Root cause et responsabilités non déterminées | Poursuivre les échanges avec notre prestataire réseau pour identifier la cause de l'incident |
Veuillez nous excuser pour la gêne occasionnée par cet incident.