Saltar a contenido

Monitoreo

Visión general

El sistema de monitoreo supervisa la disponibilidad, rendimiento y salud de todos los servidores y servicios del homelab.

Herramientas

Herramienta Propósito Ruta
Uptime Kuma Monitoreo de disponibilidad HTTP/HTTPS /opt/uptime-kuma/
Node Exporter Métricas de servidor (Prometheus) /opt/node-exporter/
(opcional) Grafana Dashboards de métricas /opt/grafana/

Uptime Kuma

  • URL: https://status.gntech.dev
  • Puerto: 3001
  • Configuración: /opt/uptime-kuma/data/

Monitores configurados

Monitor Tipo Intervalo Límite
Jellyfin HTTP 60s 5s timeout
Cloudflare Tunnel Ping 60s 3 intentos
Proxmox VE HTTP 120s 10s timeout
PBS HTTP 300s 10s timeout
Servicios Arrs HTTP 120s 5s timeout
Internet Ping 60s 3 intentos

Notificaciones

  • Canal principal: Telegram
  • Formato: Nombre del servicio + estado + tiempo de caída
  • Silenciamiento nocturno: 00:00 - 06:00 (servicios no críticos)
  • Escalado: Si el servicio no responde > 5 minutos, notificar al administrador

Métricas de servidor

  • CPU: Uso por core, temperatura
  • RAM: Uso total, disponible, swap
  • Disco: Uso por partición, I/O, salud SMART
  • Red: Ancho de banda por interfaz, conexiones activas
  • Docker: Estado de contenedores, logs de errores

Alertas

Alerta Condición Acción
Servicio caído 2 checks fallidos consecutivos Notificar Telegram
Disco lleno Uso > 85% Notificar + limpieza automática
CPU alta > 90% por 5 minutos Notificar
RAM baja < 10% disponible Notificar
Backup fallido 3 días sin backup exitoso Notificar + revisar manual