서비스 품질(QoS) 모니터

서비스 품질(QoS)은 Domino® 서버가 항상 안정적으로 작동하고 가용하도록 하기 위해 Domino 서버의 일반 조작에 반응하도록 디자인되었습니다. QoS가 서버가 응답하지 않거나 정지되었음을 발견한 경우 관리자에게 문제점에 대해 이메일을 전송하거나 자동으로 서버를 종료하고 다시 시작하도록 QoS 프로브를 구성할 수 있습니다. 지원 센터에서 분석하는 데도 QoS 로그 정보가 유용할 수 있습니다.

이 태스크 정보

경고: QoS 및 오류 복구는 동시에 사용할 수 없습니다.
중요사항: QoS가 server.id 파일에 비밀번호가 있는 서버를 (다시)시작하는 경우 관리자가 해당 서버에서 콘솔에 연결하여 비밀번호를 입력하기 전까지는 서버가 시작되지 않습니다. 따라서 관리자가 수동으로 비밀번호를 입력할 수 없는 불편한 시간에 이런 개입이 없이도 QoS가 특정 서버의 Domino를 (다시) 시작할 수 있도록 하려면 해당 서버의 server.id 파일에 비밀번호를 사용하지 마십시오.

QoS를 사용하려면 Domino® 서버를 Java 콘솔을 사용하여 Java 제어기에서 실행해야 합니다.

서버 NOTES.INI 파일에서 Domino® 서버의 다음 설정을 사용하여 qosprobe 추가 기능 태스크를 구성할 수 있습니다.
  • QOS_PROBE_INTERVAL=n

    프로브 간격(분)입니다. 이 항목은 notes.ini에 설정할 수 있습니다. 기본값은 1분입니다.

  • QOS_PROBE_TIMEOUT=n

    프로브 제한시간(분)입니다. 이 항목은 dcontroller.ini에 설정할 수 있습니다. 기본값은 5분입니다.

팁: QOS_PROBE_TIMEOUTQOS_PROBE_INTERVAL보다 커야 합니다. 프로브가 응답하도록 설정되기 전에 제한시간이 발생할 경우 서버가 끊임없이 다시 시작됩니다.
서버 제어기에서 qosprobe 추가 기능이 프로브 결과를 전달하는 메시지 큐를 모니터링합니다. (SUCCESS, ERROR, TIMEOUT) 메시지는 서버 데이터 디렉토리에 있는 qosctnrlrtimestamp.out 파일에 캡처됩니다. 다음은 SUCCESS 메시지 예제입니다.
2010/01/07 07:42:56 QoS Probe: SUCCESS (88ms)
다음은 오류 메시지의 예입니다.
2010/01/07 08:05:59 QoS Probe: ERROR: ProbeError=4803
QoS 서버가 활성화된 경우 TIMEOUT이 발생하면 제어기가 서버를 강제 종료하고 다시 시작합니다. 다음과 같은 경우 제한시간 초과가 발생할 수 있습니다.
  • 프로브에서 사용한 NSFDbOpen 또는 NIFOpenCollection 호출에서 Domino의 ERR_TIMEOUT 오류를 반환할 경우. 이 오류가 제어기에 전송되고 스마트 강제 삭제/재시작이 시작됩니다. 제어기가 제한시간 기간(QOS_PROBE_TIMEOUT) 내에 qosprobe에서 메시지를 받지 못한 경우. 다음 중 하나의 방법으로 이를 수행할 수 있습니다. qosprobe가 종료되도록 지시를 받았거나('tell qosprobe quit') 실행되고 있지 않습니다. qosprobe는 프로브 중에 중단됩니다.

제어기가 프로브 제한시간 초과를 수신할 경우 장기간 실행되고 있거나 로드 부담이 큰 작업이 실행 중이기 때문에(이 경우 프로브 제한시간 초과가 발생할 수 있음) 서버 강제 종료/재시작을 시작할 수 없습니다. 이런 작업에는 BACKUP, COMPACT, DBCOPY, FIXUP 및 DBPURGE가 포함됩니다. 이 경우 qoscntrlrtimestamp.out 파일에 다음과 같은 메시지가 표시됩니다.

2010/01/07 07:42:56 QoS Controller: The controller has received a probe timeout.
2010/01/07 07:42:56 QoS Controller: There are long running applications - probing will pause until they have completed.

이 조건이 발견되면 제어기는 장기적인("장기간 실행 중인") 작업에 더 많은 시간을 허용하여 완료할 수 있도록 합니다. 해당 시간 내에 시간이 오래 걸리는 작업을 완료하지 못한 경우 제어기는 스마트 강제 종료/재시작을 진행합니다. qoscntrlrtimestamp.out 파일에 다음 예제와 같은 메시지가 표시됩니다.

2010/01/07 07:42:56 QoS Controller: Applications are not making progress.
중요사항: 다음 6개 NOTES.INI 값의 경우 값을 구성하지 않거나 기본값보다 작게 값을 구성한 경우 기본값이 적용됩니다. 값을 기본값보다 크게만 변경할 수 있습니다.
  • QOS_PROBE_INTERVAL
  • QOS_PROBE_TIMEOUT
  • QOS_RESTART_LIMIT_PERIOD
  • QOS_SHUTDOWN_TIMEOUT
  • QOS_RESTART_TIMEOUT
  • QOS_APPS_TIMEOUT

프로시저

다음 태스크를 수행하십시오.