Reprise après incident dans une grappe

La capacité d'un serveur HCL Domino® à éliminer les données superflues et à redémarrer automatiquement après une défaillance porte le nom de reprise après incident. Les grappes Domino® prennent en charge cette fonctionnalité. Si aucun serveur Domino® n'est prévu pour gérer le basculement, la reprise après incident garantit tout de même un accès constant des utilisateurs à leurs données. Même si les utilisateurs basculent sur un autre serveur de la grappe, la reprise après incident augmente encore davantage la disponibilité puisque le serveur défaillant redevient opérationnel. De plus, selon les paramètres d'équilibrage des charges que vous avez définis, certains utilisateurs sont redirigés vers le serveur d'origine quand ils ouvrent de nouvelles bases.

Pourquoi et quand exécuter cette tâche

Si vous utilisez une grappe de systèmes en combinaison avec une grappe Domino®, l'exécution de la reprise après incident dépend de la manière dont vous avez configuré votre grappe de systèmes. Si vous l'avez configurée afin qu'elle bascule uniquement en cas de défaillance matérielle, le processus de reprise après incident fonctionnera sans problème. Il redémarrera Domino® sur son serveur actuel, sans basculement.

En revanche, si vous l'avez configurée pour qu'elle bascule en cas de défaillances matérielle et logicielle, vous n'avez pas besoin de reprise après incident dans la mesure où la grappe de systèmes réexécutera Domino® sur un autre serveur de la grappe. En fait, il est conseillé de désactiver la reprise après incident afin d'éviter le redémarrage simultané de Domino® par Domino lui-même et de la grappe de systèmes.

Par défaut, la reprise après incident est désactivée. Vous pouvez l'activer dans le document Serveur.

Procédure

  1. Dans Domino® Administrator ou Web Administrator, cliquez sur l'onglet Configuration.
  2. Dans le panneau Tâches, développez Serveur et cliquez sur Tous les documents Serveur.
  3. Dans le panneau Résultats, sélectionnez le document Serveur souhaité, cliquez sur Editer serveur, puis sur l'onglet Général.
  4. Dans la section Reprise après incident, cochez la case Activé dans le champ Redémarrer automatiquement le serveur après un incident/blocage.
  5. Facultatif : Renseignez l'un ou plusieurs des champs suivants.
    • Dans le champ Exécuter ce script après un incident/blocage serveur, entrez le nom d'un script de nettoyage.
      Remarque : N'essayez pas d'activer NSD à partir de ce champ. Cette opération est réalisable à partir du champ Exécuter NSD pour effectuer une collecte des informations de diagnostics.
    • Dans le champ Exécuter NSD pour effectuer une collecte des informations de diagnostics, cochez la case Activé pour activer NSD en cas d'incident ou de blocage.
    • Dans le champ Durée d'exécution maximale de NSD/du script de nettoyage, entrez la durée maximale d'exécution d'un script de nettoyage. La valeur maximale que vous pouvez spécifier est 1 800 secondes.
    • Dans le champ Nombre maximal d'incidents, entrez le nombre maximal de redémarrages accordé au cours de la période spécifiée. Si le nombre de redémarrages excède cette limite, le serveur ne redémarrera pas.
    • Dans le champ Notification d'incident envoyée par message électronique à, entrez les noms des personnes ou des groupes qui doivent recevoir un message de notification électronique chaque fois que le serveur redémarre.
  6. Effectuez toutes vos autres modifications dans le document Serveur, puis cliquez sur Enregistrer et fermer.