Jest sobie VM zbierająca dużo rzeczy z monitoringu - nagios + pnp4nagios. Dane następnie trafiają do plików rrd.
Wszystko działa dobrze, natomiast intensywny i częsty zapis "zarzyna" dyski.
Raid na dyskach talerzowych - nie daje rady. Użycie ssd - powoduje, że wszystko działa prawidłowo, natomiast martwię się o trwałość dysków SSD. Po Tygodniu użycia "Percentage Used Endurance Indicator" ze smarta dysków SSD osiągnął 7 procent. Przy takim tempie dyski nie wytrzymają dłużej niż pół roku.
Ma ktoś może jakiś pomysł na mechanizm pozwalający na duże opóźnienie zapisu w jednym katalogu, ale zapewniające, że w przypadku awarii dane nie zostaną utracone na zbyt długo (brak danych z np. godziny w przypadku wyłączenia/restartu maszyny monitorującej nie jest problemem, ale całkowita utrata danych - owszem).
Myślałem o użyciu ramdysku i następnie synchronizowania go na ssd co np. pół godziny. Ale może jest jakiś inny/lepszy mechanizm?
Zastanawiałem się też nad operacją w stylu snapshot lvma na pv umieszczonym na ramdysku, używanie snapshotu, a następnie co pół godziny merge snapshota na ssd.
Sumarycznie aktualizowane pliki rrd zajmują kilkanaście GB - sama synchronizacja zawsze potrwa więc zawsze trochę czasu.