Producción está caída. Vamos a arreglarlo.
Triaje y estabilización liderados por personas para incidentes activos en servidores Linux y sitios web en producción. Sin cola de tickets — acceso directo a un ingeniero sénior.
Qué ocurre cuando contacta con nosotros
Está lidiando con una caída, una vulneración o un sistema que se degrada rápidamente. Lo entiendo. Así es como funciona:
Contengo el daño.
Detener la hemorragia primero. Si un servicio se reinicia en bucle, si un disco está lleno, si algo ha sido comprometido — lo estabilizo antes de cualquier otra cosa.
Evalúo lo que pasó.
Cambios recientes, registros de errores, estado de servicios, agotamiento de recursos — examino las evidencias y determino qué falló y por qué.
Recupero o revierto.
Dependiendo de lo que sea posible, corrijo la causa raíz y restablezco los servicios, o ejecuto un rollback seguro al último estado funcional conocido.
Lo documento todo.
Una vez apagado el fuego, recibe un resumen escrito: qué pasó, qué hice, qué lo causó y qué hacer para que no vuelva a ocurrir.
Lo que necesito de usted
- Acceso SSH a los sistemas afectados (o una forma de obtenerlo rápidamente)
- Una persona de contacto designada que pueda responder preguntas y aprobar cambios
- Contexto — qué cambió recientemente, cuándo empezó, qué ha intentado ya
Cuanto antes tenga acceso, antes se resuelve.
Tiempo de respuesta
Esto no es un NOC 24/7. Soy un ingeniero con sede en Dinamarca (CET/CEST). Durante el horario laboral, respondo a solicitudes urgentes en menos de una hora. Fuera del horario laboral, responderé en cuanto lo vea — normalmente en pocas horas.
Si necesita tiempos de respuesta SLA garantizados las 24 horas, eso no es lo que ofrezco. Lo que ofrezco es un ingeniero sénior que realmente entiende su sistema y puede arreglarlo, no un junior leyendo de un manual.
Qué cubre
- Caídas de servidores Linux y fallos de servicios
- Errores de aplicaciones web y problemas de bases de datos
- Sospechas de compromisos de seguridad — contención y evaluación
- Despliegues fallidos y actualizaciones rotas
- Emergencias de DNS, SSL y redes
- Agotamiento de disco, memoria y recursos
Qué no cubre
- Servidores Windows o stacks de software propietario
- Monitorización continua o alertas proactivas (eso es Soporte y Monitorización)
- Optimización del rendimiento o desarrollo de funcionalidades
- Cualquier cosa que no sea un incidente activo
Cuánto cuesta
Si es nuevo, la vía más rápida es reservar una Revisión de Salud con el complemento de Recuperación Urgente: Revisión de Salud 650 € (la auditoría base) + Complemento de Recuperación Urgente 425 € (salta la cola, respuesta prioritaria).
La Revisión de Salud me da el contexto que necesito para arreglar las cosas correctamente, no solo parchear síntomas. El complemento de Recuperación Urgente significa que empiezo de inmediato en lugar de en 48 horas.
Si ya es cliente con una Revisión de Salud o soporte continuo, el trabajo de emergencia se factura a una tarifa acordada contra su retención. Ya tiene acceso prioritario.
Después de la emergencia
Una vez que todo está estable, averiguamos cómo prevenir que se repita. Eso normalmente significa una de dos cosas:
Un seguimiento con Revisión de Salud — si hicimos el triaje bajo presión, una auditoría adecuada encuentra todo lo demás que está a punto de fallar.
Soporte y Monitorización continua — para que el próximo problema lo detecte la monitorización automatizada antes de convertirse en una emergencia.
La mejor emergencia es la que nunca ocurre.