Używam Nagiosa bardzo intensywnie. Mam dużo własnych skryptów, monitorujących przeróżne usługi, które są podczepione pod Nagiosa.
Ostatnio jednak powoli zaczyna mi brakować w nim możliwości. Ot:
- nie znalazłem łatwiej możliwości agregacji monitorowanych serwisów tak, by móc np. podnieść alarm w sytuacji, gdy 2 z 3 serwisów udostępniających jakąś funkcjonalność przestały działać. Niby jest BPI, ale to nie do końca tak wygląda, jakbym chciał,
- nie znalazłem łatwiej możliwości predykcji alarmów. Ot wyczerpuje się miejsce na dysku, dane o tym dostaję w perf'ie, więc można by wyliczyć, kiedy miejsce dojdzie do wartości krytycznych i np. podnieść alarm 3 dni wcześniej,
- nie znalazłem łatwej możliwości analizy trendów i podnoszenia alarmu w sytuacji, gdy wartości są znacząco odbiegające od trendu,
- bardzo brakuje możliwości wrzucania "dynamicznych" błędów. Takich, które normalnie nie są widoczne ani sprawdzane, a jakiś trap (snmptrap czy też chociażby mail) powoduje pokazanie błędu, który zniknie dopiero po ocknięciu/kolejnym trapie,
- brakuje mi możliwości zdefiniowania jednego serwisu, ale różnie się zachowującego w zależności od timeperiod np. mającego różne wartości graniczne,
- brakuje wreszcie możliwości integracji z systemem ticketowym - OTRS-em tak, by alarm w Nagiosie wyzwalał incydent do obsłużenia w OTRS-ie(tak, wiem o system monitoringu, ale to kpina), ale także, by otwarta procedura zmiany mogła "unieaktywnić" alarmy na zmienianych elementach.
Życzeń mógłbym wyliczać wiele. Wiele z nich można jakoś w Nagiosie wydłubać własnymi pluginami, tudzież automatami z boku, które przez API coś tam robią. Ale zastanawiam się, czy nie ma czegoś lepszego?
Czegoś, co by pozwoliło bezproblemowo zmigrować konfigurację z Nagiosa (włącznie ze skryptami!), a było bardziej rozbudowane, jeżeli chodzi o integrację z innymi środowiskami i bardziej "ficzerowe"? Trochę tematów rozwiązuje Zabbix, ale też z tego, co wiem nie wszystko, do tego przeraża mnie migracja. A może jeszcze coś innego?