






Contexte
Mon client souhaitait obtenir une meilleure visibilité sur son système d’information. Jusqu’alors, aucune solution de monitoring centralisée n’était en place, ce qui compliquait l’analyse des incidents et ralentissait la prise de décision.
Problème
Le SI souffrait de latences sporadiques, de ralentissements et d’une activité globale opaque. Impossible d’identifier rapidement les goulots d’étranglement ou les applications les plus consommatrices de ressources.
Solution
J’ai conçu et déployé une stack complète d'observabilité :
- Umami pour collecter les analytics et suivre le comportement utilisateur en temps réel.
- Prometheus pour agréger les métriques système et applicatives.
- Loki + Alloy pour centraliser et indexer les logs de l’ensemble des services.
- Grafana pour visualiser les métriques et offrir aux équipes un tableau de bord clair et interactif.
- Alerting automatisé via Prometheus + Slack pour être notifié dès qu’un seuil critique est franchi.
section_works_4_6_solution
section_works_4_7_solution
Impact
- Détection et suppression de process inutiles permettant de libérer 15% de RAM.
- Identification des applications les plus gourmandes, permettant une priorisation des optimisations.
- Un gain de 3h par semaine pour l’équipe Customer Success, qui peut désormais se concentrer sur l’accompagnement stratégique des clients plutôt que sur du copier-coller.