воскресенье, 5 февраля 2017 г.

Чудеса на виражах, в этот раз lvm snapshot

Во время совершенно обычного планового ребута один из debian серверов вдруг не поднялся.

Ну, с матерком и болью добрались, подцепили монитор, выпадает в rescue потому что не может подцепить одну точку монтирования вдруг.

Идиотизм конечно: ни рутовую, ни какую либо важную для сервисов, тем не менее загрузка невозможна.

Ну ладно начинаем разбираться а чего вдруг примонтировать то не может, и оказывается интересная штука.

Там lvm группа, конечно же, и один из snapshot оказался переполненным и как следствие inactive.

И это ломает каким то образом множество томов при загрузке, переводя их в inactive
и в том числе тот злополучный раздел.
Что особенно изумляет, что переполненный снапшот и тот раздел никак не связаны. Они на разных pv, не являются снимками друг друга, но тем не менее переполненность одного переводит другой в inactive.

Ну вот как это назвать приличным словом?

Будем сейчас специальным скриптом ansible перезагружать, который будет снапшоты проверять видимо.