Coraid Nagios Disk Monitoring

Table of Contents

Principe

Exemples

  1. Lblade offline
  2. Lblade failed
  3. Lblade online. Init in process
  4. Lblade online and ok
  5. Lblade failed and degraded

Principe

Coraid NDM (Nagios Disk Monitoring) est un plugin Nagios dédié au monitoring des
produits Coraid.

Ce plugin est installé sur un serveur qui est raccordé directement à la baie Coraid via
une liaison série (câble RS232).

Architecture :


Coraid NDM permet de monitorer:

Coraid NDM ne permet pas de monitorer :

Exemples

Ci-dessous quelques exemples et copies d'écran issues de la console Nagios après des remontées
d’informations de Coraid NDM et la configuration de la baie Coraid (via HyperTerminal).

1. Lblade offline

Un lblade offline en raid 5 sur 3 disques en phase d’initialisation.

Etat : Warning. Ce niveau est levé à cause du lblade offline. Le temps estimé de l’initialisation
est rappelé (timeleft).

Copie d'écran Nagios:

Copie d'écran HyperTerminal:


2. Lblade failed

Un lblade avec 2 disques en raid1 (mirroring) dont un ‘failed’

Etat : Critical. Ce niveau est levé bien que le lblade continue à fonctionner en mode dégradé à
cause du disque inutilisable.

Copie d'écran Nagios:

Copie d'écran HyperTerminal:


3. Lblade online. Initialisation in process

Un lblade online constitué de 3 disques en raid5 en phase d’initialisation

Etat : OK. La durée de la phase d’initialisation est annoncé

Copie d'écran Nagios:

Copie d'écran HyperTerminal:


ATTENTION : nous ne recommandons pas de mettre online un lblade en cours d'initialisation (la perte d'un disque lors de cette phase entraîne la perte du lblade). La prochaine version de l'outil Coraid NDM remontera le status warning dans le cas présent.

4. Lblade online and ok

Un lblade online avec 4 disques en raid0 (stripping)

Etat : OK. Aucuns disques ‘failed’, aucuns lblade ‘failed’ ou ‘offline’

Copie d'écran Nagios:

Copie d'écran HyperTerminal:


5. Lblade failed and degraded

Un lblade online de 2 disques en raid 0 (stripping) auquel a été rajouté (grow) un raid 1 de 2 disques.

Etat : Critical. Le sous lblade 2.0 ne fonctionne pas à cause du disque 100.0 et le sous lblade 2.1
fonctionne en mode dégradé suite à un remplacement de disque (100.2), l’ensemble du lblade 2
ne fonctionne pas à cause du disque ‘failed’.

Copie d'écran Nagios:

Copie d'écran HyperTerminal: