Postmortem : Fichiers inaccessibles
Résumé
Le 12 mars 2025, une indisponibilité des fichiers a été constatée sur Whaller SaaS. Cet incident était dû à un problème chez notre hébergeur OVHcloud, qui a rencontré un dysfonctionnement de son service Keystone API à partir de 18:15 UTC (19:15 heure locale). L'indisponibilité a duré 3 heures et 10 minutes, le problème ayant été résolu à 21:25 UTC (22:25 heure locale). Durant cette période, les fichiers hébergés sur Object Storage étaient inaccessibles, sauf ceux mis en cache (images). Le service a été rétabli après la résolution de l'incident par OVHcloud et une vérification de notre côté.
Chronologie des événements
- 18:15 UTC (19:15 heure locale) : Début de l'incident chez OVHcloud, affectant le service Keystone API.
- 19:59 : Détection d'un problème d'affichage de fichiers et de logos dans l'annuaire sur Whaller.
- 20:08 : Déclaration de l'incident sur StatusPage par les équipes techniques de Whaller.
- 20:12 : Création d'un incident chez OVHcloud pour suivi.
- 20:18 : Confirmation que l'incident est lié à OVHcloud, suivi de l'incident sur leur plateforme.
- 21:25 UTC (22:25 heure locale) : OVHcloud annonce la résolution du problème.
- 22:40 : Clôture de l'incident chez OVHcloud après vérification du retour à la normale.
- 22:43 : Vérification de l'accès aux fichiers et clôture de l'incident sur Whaller.
Difficultés rencontrées
Côté OVHcloud :
- Une panne du service Keystone API a rendu l’authentification impossible pour les services Object Storage utilisés par Whaller
- Le diagnostic initial a pris du temps, allongeant la durée de l’incident.
Côté Whaller :
- Aucune action technique directe possible, la dépendance à OVHcloud limitant les capacités d’intervention.
- Le manque d’informations précises au début de l’incident a retardé la confirmation de l’origine du problème mais n'a pas impacté la résolution en temps que telle
Cause de l'incident
Un dysfonctionnement du service Keystone API d’OVHcloud a entraîné une impossibilité d’authentification aux services de stockage, impactant la disponibilité des fichiers Whaller SaaS stockés sur Object Storage.
Perte de données
Aucune perte de données n’a été constatée. L’accès aux fichiers a été rétabli dès la résolution de l’incident.
Source
Voici le lien vers le postmortem OVHcloud : https://public-cloud.status-ovhcloud.com/incidents/9myc4g6tfvlb