Another disaster…

Pues sí, otra vez caída del server.

El otro día, estando tan tranquilo, de repente el servidor se apaga. Está claro que la fuente de alimentación ha pasado a mejor vida.

Encargo una nueva fuente, pero esta vez del doble de potencia, en vez de 300W, una de 600, para estar seguros que no volverá a pasar. También, por si las moscas, he comprado un UPS, para proteger de picos de tensión y caídas accidentales del fluido eléctrico.

Pues bien, al conectar la fuente una vez instalada, al pulsar el power, comenzó a explotar, como si tuviese petardos dentro. Tras la mascletà, todo huele a electrónica quemada. Es evidente que el problema ha sido la nueva placa base que tenía poco más de una semana.

Afortunadamente, tras contar el caso al dependiente de Alternate, me ha cambiado sin problemas la placa y la fuente. Por suerte, además, nada más se ha estropeado, pues todo estaba conectado a la placa cuando el petardazo.

Veamos cuánto tiempo aguantamos ahora…

Disaster recovered: los detalles

Finalmente, ya está el servidor completamente funcional, pues quedó pendiente el audio que no parecía detectar la tarjeta integrada en placa.

Por lo pronto, tengo dos módulos de 512MB RAM DDR2 a 533MHz que regalo a quien los quiera, pues como compré 1GB pensando que de aquí venía el problema, ahora me sobran… (en las nuevas placas, sólo hay dos slots para RAM, no como antes con cuatro).

Ahora, los detalles de cómo ocurrió todo:

Al levantarme por la mañana, observo que el PC está tostado, el Pertellian no se mueve y ha quedado con la última hora en la que el PC funcionó: las 00:36. Otras veces, imagino que debido a la tarjeta de vídeo, el PC se tuesta, así que, apliqué la “típica receta”: botonazo.

Al levantarse el PC, justo cuando tras el grub carga el kernel, comienzan a salir líneas con errores, aunque intercaladas con el resto de líneas:

ata3.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x2 frozen

Dejé que terminase de arrancar (tras casi 15 minutos) y lo volví apagar de forma ordenada. Esa misma tarde, con una live CD pasé un memtest86, saliendo esto:

Errores en la RAM

Errores en la RAM

Hasta el fin de semana, no pude acercarme a por unas pastillas de RAM. Llegado el sábado, salí pitando a por unas, pero como se suele decir, mi gozo en un pozo. Tras ponerlas, todo igual, ¡incluso los errores del MemTest!. Saqué y volví a poner los módulos, pasando ya con éxito la prueba de RAM, pero los errores seguían.

Con una LiveCD de Ubuntu y con todo desconectado de la placa (discos duros, tarjetas…) comprobé que los errores seguían, así que, por ahí debían venir los problemas y no por la RAM. Como el PC no es nuevo, es complicado conseguir una nueva placa base, pero por otro lado, las que hay son muy baratas, así que, encargué una MSI con chipset nvidia…

MSI P6NGM-FIH

MSI P6NGM-FIH

Durante cambio de placa hubo un momento pánico: el disipador de la CPU no enganchaba, sin embargo, al mover la placa antigua, pude ver cómo por debajo tiene un soporte que lo solucionó todo.

Para terminar, no creo que sea necesario contar el final de la historia… el servidor vuelve a la carga.

Disaster recovered

El anterior post parece haber sido premonitorio: a los pocos días de instaurar un sistema de backup seguro, el servidor decide dejar de funcionar.

En un principio, todo apuntaba a la memoria RAM, pero tras comprar unas nuevas pastillas, todo seguía igual, así que, desconectando hardware no necesario y con una live-cd, pude ver que el problema seguía apareciendo.

Finalmente, el diagnóstico diferencial señaló a la placa base como la razón de los problemas. Así pues, tras encargar una nueva, aquí estamos de nuevo, eso sí, sin audio que por algún motivo no va…

Más detalles próximamente