Check_Ganglia_metzric.

Ganglia-Metrik-Check-Plugin für Nagios
Jetzt downloaden

Check_Ganglia_metzric. Ranking & Zusammenfassung

Anzeige

  • Rating:
  • Lizenz:
  • Freely Distributable
  • Name des Herausgebers:
  • Michael T. Conigliaro
  • Website des Verlags:
  • http://conigliaro.org

Check_Ganglia_metzric. Stichworte


Check_Ganglia_metzric. Beschreibung

Ganglien-Metrik-Check-Plugin für Nagios Check_Ganglia_Metric ist ein Nagios-Plugin, mit dem Sie Alarme auf irgendeiner Gangli-METRIC-METRIC auslösen können Ihr Nagios-Server und der Ganglia-Meta-Daemon laufen auf demselben Host, Sie müssen wahrscheinlich Ihre GMETAD.CONF bearbeiten, um Remote-Anschlüsse von Ihrem Nagios-Server zuzulassen. Verbindungen von nagios-server.example.com:Trusted_hosts Nagios-Server.Example .comTO Zulassen von Verbindungen von allen Hosts (wahrscheinlich ein Sicherheitsrisiko): ALLES_TRAUSTED AUFTEIDUNG AUF DEM COMMAND LineFirst, Mal, ob Check_Ganglia_Metric mit dem Gangli-Meta-Daemon kommunizieren kann: CHECK_GANGLIA_METRIC.PY -GETMETAD_HOST = GMETAD-Server.example.com \ - metric_host = host.example.com - metric_name = cpu_idlestatus OK, CPU Leerlauf = 99,3% | CPU_IDLE = 99,3% ;;;; Der "Status OK" -Meldung zeigt an, dass Che CK_Ganglia_Metric arbeitet. Wenn Sie Probleme haben, diese zur Arbeit zu erhalten server.example.com \ --metric_host = host.example.com --metric_name = cpu_idle --kritisch = 99Statuskritisch, CPU-Leerlauf = 99,6% | CPU_IDLE = 99,6% ;; 99 ;; Wir haben den Check_Ganglia_Metric erzählt, um ein "kritisches" zurückzugeben "Status, wenn die Leerlauf-CPU größer als 99 war. Die Nachricht" Statuskritische "zeigt an, dass es funktioniert hat. Beachten Sie, dass Check_Ganglia_Metric-Analysebereiche und Schwellenwerte gemäß den offiziellen Entwicklungsrichtlinien der Nagios-Plugin-Optionen. Check_Ganglia_Metric Command_Line /usr/bin/check_Ganglia_Metric.py --gmetad_Host = GMETAD-Server.example.com --metric_host = $ hostaddress $ --metric_name = $ arg1 $ --Warning = $ arg2 $ --critical = $ arg3 $} Jetzt können Sie den obigen Befehl in Ihren Dienstdefinitionen verwenden: Definieren von Dienst {service_description CPU-Leerlauf - Ganglia Verwenden Sie einige_Template Check_Command Check_Ganglia_Metric! CPU_IDLE! 0: 20! 0: 0 host_name host.example.com} Dies funktioniert gut, bis etwas mit etwas schief geht Check_Ganglia_Metric (zB Die Cache-Datei kann nicht gelesen / geschrieben werden, der Ganglia-Metadämon kann nicht erreicht werden usw.). Zu diesem Zeitpunkt wird jeder Service, der auf Check_Ganglia_Metric setzt, fehl, was Sie möglicherweise mit Alarmen überschwemmt. Wir können dies durch den Einsatz von Serviceabhängigkeiten verhindern. Das erste, was wir brauchen, ist eine Befehlsdefinition für die Überprüfung des Alters einer Datei: Befehl definieren {command_name check_file_age command_line / usr / lib / nagios / plugins / check_file_age -f $ arg1 $ - W $ arg2 $ -c $ arg3 $} Nächstes definieren wir einen Dienst, der das Alter der Cache-Datei von Check_Ganglia_Metric überprüft. Beachten Sie, dass dieser Dienst, um wirklich wirksam zu sein, mindestens als (vorzugsweise mehr) häufig überprüft werden muss als alle anderen Kontrollen, die auf check_ganglia_metzric angewiesen sind Nagios / .Check_Ganglia_Metric.cache! 60! 120 host_name localhost check_interval 1 Max_check_ATTEMPTS 1} Und schließlich richten wir die tatsächliche Serviceabhängigkeit ein. Beachten Sie, dass ich in Nagios use_regexp_matching aktiviert habe, wodurch ich reguläre Ausdrücke in meinen Richtlinien verwenden kann. Mit dem Anhaften von "- Ganglien" am Ende jedes Dienstes, der auf Check_Ganglia_Metric selt Wenn nun etwas schief geht, wird mit Check_Ganglia_Metric nur eine Warnung über die Cache-Datei gesendet, und alle abhängigen Service-Checks werden angehalten, bis Sie das Problem beheben, das den Check_Ganglia_Metric verursacht hat. Sobald das Problem behoben ist, müssen Sie den Zeitstempel in der Cache-Datei aktualisieren, um den Dienst "Cache für den CHECK_GANGLIE_METRIC" in einen OK-Status zurückzugeben (der zulässt, dass abhängige Serviceprüfungen fortgesetzt werden soll): TOUCH / VAR / LIB /nagios/.Check_Ganglia_Metric.Cachetips und TrickSIT ist möglich, eine vollständige Liste der verfügbaren Hosts und Metriken zu erhalten, indem "mehr Verbose" Logging (-VV) aktiviert werden. Da die Optionen METRIC_HOST und METRIB_NAME erforderlich sind, haben Sie hier ein bisschen "Hühner- und Ei" -Problem, aber das ist in Ordnung. Geben Sie einfach einige Dummy-Daten an. Das Plugin wird am Ende mit einem Fehler mit einem "Host / Metrik nicht gefunden" -Fehler ausgeführt, nicht, aber nicht, bevor er seinen Cache ablumpiert: Check_Ganglia_Metric.py --gmetad_host = gmetad-server.example.com \ --metric_host = dummy --metric_name = Dummy -VV-Anforderungen: · Python · Nagios. Einschränkungen: · Funktioniert nicht mit Python 2.4


Check_Ganglia_metzric. Zugehörige Software