Check my Website: Du contrôle à la notification

Il s’en passe des choses entre un contrôle et la notification. Explications sur le workflow de contrôles du service Check my Website.

Les notifications sont un sujet sensible de la supervision et c’est déjà la deuxième évolution importante que nous leur faisions subir sur le service Check my Website; et ce toujours dans l’optique d’amélioration continue du service. Ainsi, maintenant les notifications sont filtrées, paramétables tout en assurant une historisation de tous les évènements.

Voyons donc en détail ce qui se passe entre un contrôle et la notification de Check My Website.

Principes de fonctionnement

Flux du contrôle à la notification
Flux du contrôle à la notification

Il est possible de découper le flux en plusieurs points distincts :

  1. Le contrôle. Il est ordonnancé toutes les minutes par défaut par le scheduler sur le nombre de points de contrôles choisis « 3 par défaut ».
  2. La consolidation. La consolidation intervient après la réception des résultats pour les contrôles ordonnancés. Elle permet d’obtenir un état consolidé pour un site, une adresse. Toutes les résultats doivent concordés pour valider un état global.
  3. La notification. Elle permet de prévenir par tous types de moyens les personnes repsonsables d’un site en cas de problème ou de retour à la normale.

Le contrôle

Le contrôle, tel que défini plus haut peut-être complété d’un contrôle de confirmation. Celui-ci intervient 10 secondes après que le contrôle initial ai retourné un état différent du dernier état connu. C’est alors le résultat de ce test supplémentaire, même si différent du contrôle initial, qui est alors envoyé vers la consolidation. C’est un premier mécanisme implanté pour aider à diminuer les faux-positifs.

Un minimum de trois contrôles est recommandé pour obtenir 3 résultats de contrôles, donc trois états, un par serveur de test (poller).

La consolidation

La consolidation est désormais réglée à Tous par défaut. Ceci signifie qu’un état ne peut être consolidé que si l’ensemble des retours de contrôle indique un état identique, quelque qu’il soit.

Prenons un exemple. Le dernier état consolidé situe un site à ok. Deux pollers sur trois renvoient un état warning et le dernier un état ok. Il n’y a pas de concordance entres les résultats et c’est donc le dernier état consolidé connu qui est conservé.

La notification

Le service a commencé par notifier sur chaque changement d’état consolidé. C’est toujours possible mais il est également désormais possible de régler ce paramètre pour n’envoyer des notifications qu’au moment où le site est dans un état consolidé X depuis N consolidations.

Dans la console, un nouveau paramètre dans l’onglet Préférences a fait son apparition et permet de régler le nombre de Contrôles de confirmation nécessaires avant l’envoi d’une notification.

Notification
Notification

Si par exemple, vous indiquez 3 pour ce paramètre, vous serez alors notifié la troisème fois que l’état consolidé indique une valeur identique. Examinons la séquence suivante où C0 est le premier état consolidé, C1 le deuxième… :

  • C0 : ok
  • C1 : warning : pas de notification
  • C2 : warning : pas de notification
  • C3 : warning : notification
  • C4 : warning : pas de notification

La notification intervient la troisième fois que l’état consolidé se trouve dans l’état warning. Notez bien sur le diagramme de flux que cela n’affecte que les notificationsn mais pas l’historisation. Tous les changements d’états sont inscrits au journal d’événements de la console.

Compliqué ?

N’oubliez pas que si ce genre de réglages vous semblent un peu confus ou abscons, vous pouvez conserver toutes les valeurs par défaut de la console qui on été pensées pour vous offrir le maximum de réactivité tout en minimisant le « bruit », les faux-positifs.

Olivier Jan

À propos de l’auteur

| Cofondateur de Check my Website.

Check My Website a arrêté son activité en 2017, n'hésitez pas à vous tourner vers Dareboost.