Check my Website: Améliorations des notifications

Le rythme des améliorations continue bon train sur le service Check my Website et c'est de notifications qu'il s'agit aujourd'hui.

Nous avons eu de nombreux retours dès l’ouverture du service au public sur les notifications et il est vrai que le sujet est complexe. Certainement une histoire de balance à trouver entre être trop ou pas assez notifié.

Les notifications à l’ouverture du service

Au départ, nous avons réglé les notifications pour qu’elles soient envoyées par défaut sur tous les changements d’états intervenants sur un site; soit Ok, Warning et Critique.

Il s’est vite avéré que ce réglage par défaut pouvait vite générer de grandes quantités de mails en cas de ralentissements temporaires et irréguliers d’un site par exemple. Les nombreux changements d’états entre Ok et Warning, mais aussi entre Warning et Ok sont en effet salués à chaque fois d’un mail dans votre boîte.

Les notifications sont aujourd’hui possible uniquement par mail parce que nous ne souhaitons pas ouvrir celles-ci à d’autres moyens de communication comme les SMS tant que nous n’avons pas la garantie que vous ne recevrez que celles qui sont importantes à vos yeux.

Mais avant de savoir sur quoi notifier, voyons les événements qui provoquent un changement d’état.

Événements déclenchant un changement d’état

Il y a deux grandes catégories dans lesquelles ranger ces événements déclencheurs de changements d’états.

Erreurs d’exécutions

Ce sont les erreurs qui peuvent survenir pendant l’exécution d’un contrôle. Un contrôle peut prendre trop de temps, ne pas recevoir de données…

Limite de temps d’exécution d’un job

Pour maintenir un niveau élevé de contrôles à la minute, notre service ne doit pas perdre de temps avec des contrôles en erreur ou trop longs. C’est pourquoi l’état passe critique quand il n’y a pas de résultat au bout de 15 secondes.

  • État: Critique
  • Message: Job Timeout

Impossible de se connecter au serveur web

Survient lorsque le nombre de tentatives maximales pour se connecter au site web a été atteint.

  • État: Critique
  • Message: HTTP Connection Error

Aucune données reçues

La connexion au serveur web est établie mais celui-ci ne renvoie aucune donnée dans les 5 secondes.

  • État: Warning
  • Message: HTTP Read Timeout

Timeout de connexion de 5 secondes

Se produit lorsque la connexion au serveur prend plus de 5 secondes.

  • État: Critique
  • Message: HTTP Connect Timeout

Erreur réseaux généraliste

Un erreur au niveau réseau est survenue empêchant la connexion au serveur.

  • État: Critique
  • Message: HTTP Socket Error

Erreur de résolution DNS

Se produit pour toute erreur liée à la résolution DNS.

  • État: Critique
  • Message: DNS Error

Changements d’états « réglables »

Une fois l’exécution réussi, vous pouvez contrôler dans la console le seuil de déclenchement de changement d’états pour chacun des éléments suivants.

Limite de temps HTTP

Le temps total dépasse le seuil indiqué dans le réglage Limite de temps HTTP.

  • État: Warning (1)
  • Message: Time limit Reached (8)

Code retour HTTP

Le code retour HTTP envoyé par le serveur ne correspond pas au code attendu. Le code retour normalement attendu est le 200. Tout autre autre réponse doit être considérée comme problématique.

  • État: Critique
  • Message: HTTP Code Missmatch

Chaîne de caractères

La chaîne de caractères indiquée dans les préférences du site n’a pas été trouvé dans les données renvoyé par le serveur.

  • État: Crtique
  • Message: Pattern not found

Améliorations apportées aux notifications

Il est désormais possible dans l’onglet préférences d’un contrôle, site de sélectionner les états sur lesquels vous souhaitez être notifiés.

Choix des notifications en fonction de l’état
Choix des notifications en fonction de l’état

Par défaut, seuls les états Ok et Critique sont notifiés afin d’éviter les tempêtes de mails sur des oscillations entre état Ok et Warning.

En conservant ces réglages par défaut, vous êtes alertés pour chaque changement d’état de

  • Ok à Critique
  • Critique à Ok
  • Warning à Critique

Prenons un exemple concret pour illustrer les effets de ces réglages en situation. Un site est en état Ok. L’affluence fait que le site devient chargé, moins réactif. Il ne parvient pas à délivrer la réponse en moins de 5 secondes; provoquant un changement d’état en Warning. Ceci devrait se traduire en console par de nombreux événements retraçant ces passages de Ok à Warning et inversement. Avec les paramètres par défaut aucune notification n’a lieu.

UPDATE : Suite aux évolutions du moteur de notifications, les réglages par défaut sont de nouveau sur tous les changements d’état.

Aller plus loin

Les notifications sont un vaste sujet dans la supervision en générale et celle dédiée aux sites et applications web ne déroge pas à la règle. Nous ne prétendons pas avoir réglé le sujet et nous continuerons d’améliorer en continu cette partie de notre service. Vos retours, remarques et commentaires sont donc toujours les bienvenus pour nous guider, nous aider dans cette vaste tâche. Que ce soit pour qualifier un changement d’état, discuter seuils…

Olivier Jan

À propos de l’auteur

| Cofondateur de Check my Website

Check my Website est un service pour la supervision et la surveillance à distance de la disponibilité, de la performance et du bon fonctionnement des sites et applications web.

Suivez @olivjan sur Twitter !

Laissez un commentaire

comments powered by Disqus