Résumé
Un incident de production a été détecté le 19 juin 2025, entraînant l’absence de marquage en non lus des nouveaux messages et commentaires (puces et texte en gras). L'incident a été résolu après identification de la cause et déploiement d'un correctif.
Chronologie des événements
- 19/06/2025 10:03 : Détection de l’incident.
- 10:05 : Confirmation de l'incident.
- 10:40 : Identification de la cause (problème de routage du “queueing” interne)
- 10:47 : Déploiement et mise en prod du correctif
- 11:50 : Fin du traitement des données en attente, fin de l'incident.
Difficultés rencontrées
- Gestion des files d'attente saturées et impact sur les services dépendants.
Cause de l'incident
La cause de l'incident a été identifiée comme étant un problème de routage du système de “queueing” interne (traitement des instructions asynchrones).
Perte de données
Aucune perte de données n'a été rapportée durant cet incident.
Mesures de remédiation
- Correctif déployé : Une nouvelle version a été déployée pour corriger le problème.
- Surveillance renforcée : Les équipes techniques ont renforcé la surveillance des files d'attente pour détecter rapidement tout comportement anormal.
- Amélioration des processus : Révision des processus de déploiement pour éviter des incidents similaires à l'avenir.