Erreurs 502 et ralentissements / 502 errors and slowdowns
Incident Report for Whaller
Resolved
L'ensemble du système a retrouvé sa performance.
Nous avons implémenté des améliorations structurelles et logicielles afin de mieux gérer les flux de tâches asynchrones qui, avec l'augmentation du traffic, posait problème.
---
The whole system has recovered its performance.
We implemented structural and software improvements to better manage asynchronous task flows, which, with the increase in traffic, was a problem.
Posted Nov 10, 2021 - 07:27 CET
Update
Des ralentissements sont toujours observés. Nos équipes travaillent à une remédiation.
---
Slowdowns are still observed. Our teams are working on a remediation.
Posted Nov 09, 2021 - 11:40 CET
Monitoring
Les ressources mémoire ont été augmentées, et le service est à nouveau pleinement opérationnel.
Les données analytics sont en cours de dépilement et devraient être pleinement à jour dans la journée.
---
Memory resources have been increased, and the service is fully operational again.
The analytics data is currently being unstacked and should be fully up to date within the day.
Posted Nov 09, 2021 - 09:35 CET
Update
Le problème a été identifié, nous ajoutons des ressources matérielles pour supporter la charge du cluster ElastiSearch.
---
The problem has been identified, we add hardware resources to support the load of the ElastiSearch cluster.
Posted Nov 09, 2021 - 08:53 CET
Identified
Les processus asynchrones qui surchargeaient les serveurs ont été coupés. La plateforme est à nouveau accessible, mais en mode dégradé : les moteurs de recherche peuvent présenter des incohérence d'indexation (données non mises à jour en temps réel).
Nos équipes travaillent au rétablissement du service intégral au plus vite.
---
The asynchronous processes that were overloading the servers have been shut down. The platform is accessible again, but in degraded mode: the search engines may present indexing inconsistencies (data not updated in real time).
Our teams are working to restore full service as soon as possible.
Posted Nov 09, 2021 - 08:16 CET
Investigating
Une erreur 502 apparaît sur la production, nos équipes investiguent.
Nous vous prions de nous excuser pour la gêne occasionnée.

---

An error 502 appears on the production, our teams investigate.
We apologise for any inconvenience caused.
Posted Nov 09, 2021 - 08:04 CET
This incident affected: Main application, API, Push server, and Search engine, members directories, members management.