Аппаратный S.M.A.R.T. на сервере

Допустим у нас есть сервер построенный на Десктопной материнской плате. Большинство таких материнских плат умеют проверять состояние дисков во время загрузки через S.M.A.R.T. и выдавать предупреждения. Полезная штука. Особенно на сервере – там информация о Smart жизненно необходима.

Только есть небольшая проблемка. Некоторые мамки просто выводят информацию на Экран. Моя материнская плата например стопорит загрузку и ждет нажатия клавиши.

А вот ситуация которая произошла со мной совсем недавно: На сервере работает два диска в RAID 1 (mirror) на mdraid. Один из дисков выходит из строя. После чего система отказывается загружаться, хотя второй диск работает нормально. Загрузка повисает при инициализации BIOS. Обычный мерцающий курсор, но в биос пускает.

Если отключить битый диск – загрузка проходит нормально, только физического доступа к серверу нету и отключить диск нету никакой возможности. Заходим в BIOS через IP-KVM и выключаем пресловутый SMART, после чего загрузка проходит нормально. А если бы IP-KVM не было? Да и время простоя…

Отсюда большой и жирный вывод:
Отключайте проверку SMART в BIOS на серверах.

Для мониторинга SMART существует куча специальных программ под любые операционные системы, которые будут читать и анализировать информацию и заблаговременно вас в этом информировать прямо во время работы системы, а не только при загрузки.

Не повторяйте моих ошибок!)

Всем спасибо.

Комментариев нет »

Комментариев нет.

RSS-лента комментариев к этой записи. TrackBack URL

Оставить комментарий