Contrôle de QoS

QoS (Quality of Service) est conçu pour réagir au fonctionnement général d'un serveur Domino® afin de le maintenir en service et de garantir une exécution fiable à tout moment. Si QoS détecte qu'un serveur ne répond pas ou est arrêté, l'analyse QoS peut être configurée pour envoyer un courrier électronique à un administrateur pour lui signaler le problème et/ou fermer le serveur, puis le redémarrer. Les informations du journal QoS peuvent être utiles pour l'analyse du support technique.

Pourquoi et quand exécuter cette tâche

ATTENTION : Il convient de ne pas activer simultanément QoS et la fonction de reprise après incident.
Important : Si QoS (re)démarre un serveur dont le mot de passe se trouve dans le fichier server.id, le démarrage n'aura lieu qu'une fois qu'un administrateur se sera connecté à la console hébergée sur ce serveur et aura saisi ce mot de passe. Si, par conséquent, vous souhaitez que QoS puisse (re)démarrer Domino sans nécessiter d'intervention sur un serveur spécifique, par exemple à des moments peu pratiques du fait qu'aucun administrateur n'est disponible pour effectuer la saisie manuelle d'un mot de passe, n'indiquez pas de mot de passe dans le fichier server.id pour ce serveur.

QoS requiert l'exécution du serveur Domino® avec le contrôleur Java exécuté via la console Java.

La tâche complémentaire qosprobe peut être configurée avec les paramètres suivants dans le fichier NOTES.INI du serveur Domino® :
  • QOS_PROBE_INTERVAL=n

    Intervalle d'analyse en minutes. Ce paramètre peut être défini dans notes.ini. La valeur par défaut est de 1 minute.

  • QOS_PROBE_TIMEOUT=n

    Délai d'attente de l'analyse, en minutes. Ce paramètre peut être défini dans dcontroller.ini. La valeur par défaut est de 5 minutes.

Conseil : QOS_PROBE_TIMEOUT doit être supérieur à QOS_PROBE_INTERVAL. Si le délai de réponse de l'analyse dépasse le délai d'attente, le serveur est constamment redémarré.
Le contrôleur de serveur surveille une file d'attente de messages à laquelle la tâche complémentaire qosprobe transmet ses résultats d'analyse. (SUCCESS, ERROR, TIMEOUT). Les messages sont capturés dans le fichier qosctnrlrtimestamp.out du répertoire de données du serveur. Le message suivant est un exemple de message de réussite (SUCCESS) :
2010/01/07 07:42:56 QoS Probe: SUCCESS (88ms)
Voici un exemple de message d'erreur :
2010/01/07 08:05:59 QoS Probe: ERROR: ProbeError=4803
Lorsque le serveur QoS est activé et qu'un événement TIMEOUT se produit, le contrôleur arrête, puis redémarre le serveur. Le délai d'attente peut être dépassé dans l'un des cas suivants :
  • Les appels NSFDbOpen ou NIFOpenCollection utilisés par l'analyse renvoient une erreur Domino ERR_TIMEOUT. Cette erreur est envoyée au contrôleur et un arrêt/redémarrage est lancée. Le contrôleur ne reçoit pas de message de qosprobe au cours du délai d'attente (QOS_PROBE_TIMEOUT). Cela peut se produire de l'une des manières suivantes : qosprobe a été arrêté ('tell qosprobe quit') ou n'est pas en cours d'exécution. qosprobe se bloque lors de l'analyse.

Si le contrôleur est informé du dépassement du délai d'attente de l'analyse, il est possible qu'il ne lance pas la procédure d'arrêt/redémarrage du serveur car des opérations lourdes ou à exécution longue sont en cours d'exécution (et peut-être à l'origine du dépassement du délai d'attente de la sonde). Ces opérations incluent BACKUP, COMPACT, DBCOPY, FIXUP et DBPURGE. Dans ces cas, les messages suivants peuvent être consignés dans le fichierqoscntrlrtimestamp.out :

2010/01/07 07:42:56 QoS Controller: The controller has received a probe timeout.
2010/01/07 07:42:56 QoS Controller: There are long running applications - probing will pause until they have completed.

Si cette situation est détectée, le contrôleur accorde aux opérations longues plus de temps pour s'exécuter. Si une opération longue ne parvient pas à s'exécuter dans le délai imparti, le contrôleur lance une procédure d'arrêt/redémarrage. Un message comparable à celui indiqué ci-dessous est consigné dans le fichier qoscntrlrtimestamp.out :

2010/01/07 07:42:56 QoS Controller: Applications are not making progress.
Important : Pour les six valeurs suivantes de NOTES.INI, la valeur par défaut s'applique si vous n'avez pas configuré de valeur ou si la valeur configurée est inférieure à la valeur par défaut. Vous pouvez redéfinir la valeur uniquement pour indiquer une valeur supérieure à la valeur par défaut.
  • QOS_PROBE_INTERVAL
  • QOS_PROBE_TIMEOUT
  • QOS_RESTART_LIMIT_PERIOD
  • QOS_SHUTDOWN_TIMEOUT
  • QOS_RESTART_TIMEOUT
  • QOS_APPS_TIMEOUT

Procédure

Effectuez les tâches suivantes :