Kategorie szkoleń | Egzaminy | Kontakt
  • 1
  • 3
  • 69

Jest sobie VM zbierająca dużo rzeczy z monitoringu - nagios + pnp4nagios. Dane następnie trafiają do plików rrd.

Wszystko działa dobrze, natomiast intensywny i częsty zapis "zarzyna" dyski.

Raid na dyskach talerzowych - nie daje rady. Użycie ssd - powoduje, że wszystko działa prawidłowo, natomiast martwię się o trwałość dysków SSD. Po Tygodniu użycia "Percentage Used Endurance Indicator" ze smarta dysków SSD osiągnął 7 procent. Przy takim tempie dyski nie wytrzymają dłużej niż pół roku.

Ma ktoś może jakiś pomysł na mechanizm pozwalający na duże opóźnienie zapisu w jednym katalogu, ale zapewniające, że w przypadku awarii dane nie zostaną utracone na zbyt długo (brak danych z np. godziny w przypadku wyłączenia/restartu maszyny monitorującej nie jest problemem, ale całkowita utrata danych - owszem).

Myślałem o użyciu ramdysku i następnie synchronizowania go na ssd co np. pół godziny. Ale może jest jakiś inny/lepszy mechanizm?

Zastanawiałem się też nad operacją w stylu snapshot lvma na pv umieszczonym na ramdysku, używanie snapshotu, a następnie co pół godziny merge snapshota na ssd.

Sumarycznie aktualizowane pliki rrd zajmują kilkanaście GB - sama synchronizacja zawsze potrwa więc zawsze trochę czasu.

 

Andrzej_Dopierała
  • Zapytał
  • @ Andrzej_Dopierała | 01.09.2015
    • lider
    • laureat
    • ekspert
    • 83
    • 65
    • 169
Komentarze (2)
Taki link: (http://techreport.com/review/27909/the-ssd-endurance-experiment-theyre-all-dead) do zastanowienia się nad Percentage Used Endurance Indicator przy dyskach SSD.
Skomentował : @ TRENER MODERATOR ALTKOM AKADEMII ,03.09.2015
No właśnie. 300gb to uwzględniając roczny okres życia zaledwie 300kB/s zapisu cały czas. Czyli strasznie mało. Stąd szukam jakiegoś sensownego rozwiązania by moment padnięcia dysku odroczyć.
Skomentował : @ Andrzej_Dopierała ,03.09.2015
  • 83
  • 65
  • 169
Zaloguj się aby zadać pytanie
Pokrewne

Odpowiedź (1)

  • 0

Inne podejście, niektóre serwery (np. HP, bo na nich aktualnie pracuję), mają cache dla systemu RAID. W przypadku awarii cache jest podtrzymywany przez bateryjkę i po uruchomieniu serwera zapisywany na dyski.

Wiem, że rozwiązanie pociąga za sobą jakieś koszty, ale piszesz, że potrzebna jest niezawodność w czasie awarii, a ramdysk tego nie zapewni.

Jeśli jednak nie potrzebna Ci taka niezawodność, to poza ramdyskami można się jeszcze zastanowić nad tym, jakiego podejścia używa system do Twojego dysku.

1. Ponoć najlepiej dla SSD sprawuje się EXT4, ale to gdzieś tak kiedyś przeczytałem - nie wiem ile w tym prawdy.

2. Można wyłączyć journling - decyzja oczywiście odpowiednia do ważności danych.

3. Przełączenie tmp do RAM, minimalizacja użycia SWAP.

Kamil_Rosiński
  • Odpowiedział
  • @ Kamil_Rosiński | 03.02.2017
    • 1
    • 0
    • 1