Monitoreo
Visión general
El sistema de monitoreo supervisa la disponibilidad, rendimiento y salud de todos los servidores y servicios del homelab.
Herramientas
| Herramienta | Propósito | Ruta |
| Uptime Kuma | Monitoreo de disponibilidad HTTP/HTTPS | /opt/uptime-kuma/ |
| Node Exporter | Métricas de servidor (Prometheus) | /opt/node-exporter/ |
| (opcional) Grafana | Dashboards de métricas | /opt/grafana/ |
Uptime Kuma
- URL:
https://status.gntech.dev - Puerto: 3001
- Configuración:
/opt/uptime-kuma/data/
Monitores configurados
| Monitor | Tipo | Intervalo | Límite |
| Jellyfin | HTTP | 60s | 5s timeout |
| Cloudflare Tunnel | Ping | 60s | 3 intentos |
| Proxmox VE | HTTP | 120s | 10s timeout |
| PBS | HTTP | 300s | 10s timeout |
| Servicios Arrs | HTTP | 120s | 5s timeout |
| Internet | Ping | 60s | 3 intentos |
Notificaciones
- Canal principal: Telegram
- Formato: Nombre del servicio + estado + tiempo de caída
- Silenciamiento nocturno: 00:00 - 06:00 (servicios no críticos)
- Escalado: Si el servicio no responde > 5 minutos, notificar al administrador
Métricas de servidor
- CPU: Uso por core, temperatura
- RAM: Uso total, disponible, swap
- Disco: Uso por partición, I/O, salud SMART
- Red: Ancho de banda por interfaz, conexiones activas
- Docker: Estado de contenedores, logs de errores
Alertas
| Alerta | Condición | Acción |
| Servicio caído | 2 checks fallidos consecutivos | Notificar Telegram |
| Disco lleno | Uso > 85% | Notificar + limpieza automática |
| CPU alta | > 90% por 5 minutos | Notificar |
| RAM baja | < 10% disponible | Notificar |
| Backup fallido | 3 días sin backup exitoso | Notificar + revisar manual |