In english Хотелка Об авторе

Ууу, блин!

Оказывается, софтовый RAID, на котором у меня /home, развалился нафиг. Не насмерть, конечно, но никакого зеркала уже давно не было. На работе я за такими вещами, естественно, слежу, и даже эсэмэс получаю, чуть что. А дома вообще случайно заметил, добавляя в массив с сериалами ещё один диск.

Мне стыдно. Хочу, чтобы все умерли.

Теперь думаю, что бы такое сотворить, чтобы не забывать следить за дисками. И вспоминаю, за чем ещё я не слежу дома. И как это всё мониторить. Не городить же ради этого nagios icinga. А с другой стороны, не ставить же что-то другое и не заниматься велосипедостроением, когда есть уже хорошо знакомая и хорошо работающая система?

Top

Категория: desktop Слова: mdadm, software raid, monitoring

Комментарии Отключены

ZYV

Да, да, вот куда податься пролетарию умственного труда? Ну, скажем, есть у меня зеркало, на почту идут логвотчи. Юм время от времени напоминает про обновления. Есть для логвотча такой плагин, который будет мне писать типа "Папа!!! Рейд валится..."? У меня вот весь мониторинг сводится пока к логвотчу + какти, который на интерфейсы, загрузку и ещё на некоторые мелочи смотрит.

12.06.2009 // 00:52 [ ссылка ]

Ответ от Автора

Мне кажется, в dmesg должно валиться сообщение о том, что массив стал degraded. А если нет, но всё равно очень хочется в logwatch завернуть — можно по хрону разбирать /proc/mdstat (google://nagios+software+raid) и писать в логи. Ну и плагины для logwatch тоже вроде бы не слишком сложно пишутся.

Мне вот logwatch не подходит, потому что я параноик, и не хочу узнавать о дохлом винте через полдня после того, как массив с /home перестал быть зеркалом.

Несколькими простыми скриптами я могу уведомления обо всякой случившейся с машиной бяке повесить в виджеты моего awesome, но как-то оно костыльно-велосипедно, а когда начинаешь думать о фрейворке для построения таких вещей вспоминаешь про nagios/icinga.

15.06.2009 // 13:58 [ ссылка ]

ZYV

Ну, это же надо за компьютером постоянно находиться. За полдня с деградировавшим зеркалом, если нагрузка небольшая ничего не случится. Собственно ты своим постом выше это подтверждаешь. По-моему для не mission critical машинок вроде пары серверов о том о сем и пары домашних машинок logwatch вполне гуд.

Посмотрел специально, оказывается на logwatch итак есть raid-плагин и он с ним идет по умолчанию :) вопрос снимается...

С другой стороны то, что админом у хостинга работает маньяк --- это хорошо.

25.06.2009 // 15:50 [ ссылка ]

Ответ от Автора

Logwatch на домашней машине плох тем, что требует привычки регулярно просматривать отчёты. Подобные привычки притупляют внимание. Мыло типа «Achtung! Мы все умрём!», приходящее только когда возникает проблема, гораздо эффективнее.

Но не все проблемы требуют немедленного вмешательства, и для них достаточно ежедневного дайджеста (тот же logwatch). Но зачем иметь два инструмента для одного и того же? Вот и мучаюсь от своего перфекционизма. :)

Наверно правильным вариантом будет для несерьёзных проблем ругаться только в логи, чтобы logwatch их подхватил. И наверно правильный logwatch должен в Subject: указывать количество проблем разной серьёзности, чтобы можно было легко обработать его почтовым фильтром.

Кроме всего этого правильный мониторинг должен легко настраиваться и обнаруживать сервисы сам, оставляя пользователю только выставить желаемое QoS для каждого сервиса и способ оповещения. А эти мысли и вовсе уносят меня куда-то в zeroconf.

Такие дела. Надо бы найти кого-нибудь и хорошенько за рюмкой чая об этом поспорить, чтобы написать feature list и сесть кодить.

25.06.2009 // 17:45 [ ссылка ]

ZYV

Ну тут на самом деле всё не так безнадежно, как мне кажется. Мне приходят с пяток дайджестов каждый день, они кладутся в папку с дайджестами, метятся как прочитанные и, разумеется, я их не читаю регулярно. Однако можно при наличии определенных ключевиков в дайджесте метить их как непрочитанные, соответственно они будут показываться с сводке и обращать на себя внимание. Так я и поступаю.

Т.е. если у меня попросту говоря если слово RAID в digest'е фигурирует это одно значит, что что-то с ним не так.

Почтой у меня заведует Evolution, но я так полагаю, что в Claws можно сделать всё точно то же самое.

25.06.2009 // 18:15 [ ссылка ]