Cuando estamos monitorizando la salud de nuestros discos duros con SMART, podemos recibir avisos que uno de ellos empieza a eliminar sectores del disco y puede ir a mayor su degradación. El aviso que recibiriamos al e-mail de contacto seria muy parecido a este:

Para recibir estos avisos de SMART es MUY IMPORTANTE tener configurado correctamente un MTA para que envíe las notificaciones. Por ejemplo podemos configurar el paquete sSMTP de Debian con esta entrada anterior.

Si queremos curarnos en salud, es el momento de cambiar el disco y estar mas tranquilos antes de sufrir un desastre por haber aguantado mas de la cuenta, un disco que empezaba a dar algunos errores.

Puede darse el caso que con el «cat /proc/mdstat» no haya marcado como fallido el disco del RAID porqué aún lo considera válido, pero si tenemos avisos de algunos errores de SMART. Vamos a proceder a la eliminación del disco del RAID.

Llegados a este punto, quitamos el disco fallido sin parar el servidor y lo reemplazamos por uno de nuevo con las mismas características.

Queda un último detalle no menos importante, instalar el gestor de arranque Grub en el disco /dev/sdb. Sino lo hiciéramos y al cabo de 1 semana fallara el /dev/sda con parada total del servidor por «X» error el sistema no volvería arrancar con el /dev/sdb ya que no tiene gestor de arranque.

Ya hemos cambiado un disco con errores de SMART de un RAID sin parada del servidor y afectación al cliente o compañeros de trabajo.

(400 visitas en total, 1 visita/s hoy)
Tagged with →  
Share →

One Response to Cambiar disco con errores en un RAID software (mdadm) de Debian

Deja un comentario

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.