Apagón en los servidores de Mageia

De Misc y el equipo de administración de sistemas

Actualización: ¡Los servidores están de nuevo en línea y los analistas de regreso a la edición final!

Como muchos se habrán dado cuenta, sufrimos de un severo apagón el día de ayer cerca de las 00:05 CET en una de las bases de datos de los servidores.

Tal parece que un problema eléctrico detuvo algunos servidores en el cuarto Lost Oasis en Marsella, con la subsecuente consecuencia de la caída de 4 servidores (valstar, alamut, jonund y ecosse asi como la máquina virtual que corría en alamut aka friteuse_tmp). También impactó todos los servidores de zarb.org que aún se encuentran dando soporte a algunos servicios (como www, lista de correo, DNS secundario, SMTP, etc.).

Perenoel, uno de los grandes chicos de Lost Oasis, fue durante la noche al edificio a encargarse del asunto y luego los servidores volvieron a tener energía de nuevo cerca de las 00:20 CEST. La gente de Lost Oasis estuvo trabajando hasta las 4:00 am para arreglar todos los servidores.

Ahora todos, excepto dos servidores, Valtstar y Jonund,  estan de resgreso en línea.

Jonund es solo un nodo de construcción, tenemos otro y además estamos en congelamiento, asi que podemos sobrellevar la falla sin muchos problemas.

Valtstar es el servidor principal SVN y LDAP, así que prácticamente todo depende de él. Los servicios impactados son:

  • LDAP

-Sin acceso a Identity ( sin creación de cuentas )

-foro, bugzilla, transifex: la mayor parte con acceso solo de lectura, nadie puede registrarse a ellos, pero la gente que ha sido registrada están bien

-la mayor parte de los alias @mageia.org  ( lo correos siguen en que-hacer en zarb )

-acceso shell ( rabbit, champagne )

-algunas listas Sympa ( @ml.mageia.org ), la mayoría del consejo

  • SVN
  • sistema de construcción ( sin programador , sin espejos para constructores )
  • administrador automático de todos los servicios ( sin marionetero )

El resto (página web, blog, xymon, lista de correos, red de svn) deberían estar bien. Aún seguimos checandolos. El equipo de Lost Oasis nos ha dicho que observarán nuestro servidor en la tarde, los mantendremos informados de los cambios mediante correo electrónico en nuestra lista de correo.

Los administradores verán la forma de crear una infraestructura mas elástica para éstos problemas (por ejemplo, un segundo LDAP traería muchas mas cosas, y ésta ya ha sido planeado).

Si tienen alguna pregunta por favor preguntan en la lista de correo de administradores de sistemas o en el canal IRC #mageia-sysadm en Freenode, donde con gusto te responderemos.

Actualización (13:10 CEST): todos lo sistemas están de regreso, encendidos y operacionales ahora. \o/

Publicación: ennael , Traducción: MichaelSOG

Esta entrada fue publicada en Sin categoría y etiquetada , , , , , . Guarda el enlace permanente.

Una respuesta a Apagón en los servidores de Mageia

  1. Shapord dijo:

    Que novela!!!! XDDD, buen trabajo chicos, los ojos del mundo están ante ustedes y no lo están haciendo nada mal, gracias por mantener el espíritu linuxero intacto!!! Slds desde Peru