Introducción a Nagios Core

February 5, 2026 10 minute read

Introducción

En este artículo veremos cómo instalar Nagios Core desde cero y, lo más importante, cómo aprender a usarlo de forma práctica, entendiendo qué se monitoriza y cómo interpretar las alertas.

El objetivo no es solo “tener Nagios funcionando”, sino comprender qué hace cada servicio y por qué.

¿Qué es Nagios?

Nagios Core es una herramienta de monitorización de sistemas y servicios ampliamente utilizada en entornos profesionales. Su función principal es detectar problemas antes de que afecten a los usuarios, alertando cuando un sistema empieza a degradarse o cuando un servicio deja de funcionar.

Nagios se basa en una idea muy simple:

“Comprobar periódicamente el estado de hosts y servicios, y avisar cuando algo no va bien.”

Principales características de Nagios:

Monitorización de hosts (servidores, routers, máquinas virtuales)
Monitorización de servicios (CPU, disco, red, procesos, aplicaciones)
Sistema de alertas basado en estados: OK, WARNING y CRITICAL
Arquitectura extensible mediante plugins
Configuración basada en ficheros de texto (muy flexible)
Enfoque preventivo: detectar problemas antes de la caída

Nagios no soluciona los problemas, pero te avisa con antelación para que puedas actuar.

Ediciones de Nagios: Core y Nagios XI

Una vez entendido cómo funciona Nagios Core y cómo se configuran los servicios básicos, es importante conocer qué otras ediciones y enfoques existen dentro del ecosistema Nagios, y en qué casos es recomendable cada uno.

¿Qué es Nagios Core?

Nagios Core es el motor de monitorización. Es software libre (open source) y es la base de todo lo demás.

Qué incluye

Motor de chequeos (scheduler)
Sistema de estados: OK / WARNING / CRITICAL / UNKNOWN
Sistema de alertas (email, scripts, etc.)
Soporte de plugins
Configuración por ficheros .cfg
Interfaz web muy básica

Ventajas

Ligero
Extremadamente flexible
Muy estable
Gran ecosistema de plugins

Inconvenientes

Curva de aprendizaje
Mucha configuración manual
Interfaz obsoleta

Nagios XI

Nagios XI es un producto comercial que usa Nagios Core por debajo, pero añade una capa completa de gestión.

¿Qué añade sobre Core?

Interfaz web moderna
Dashboards personalizables
Configuración 100% gráfica
Informes avanzados
Gestión de usuarios y roles
Asistentes de configuración (wizards)
Soporte oficial de Nagios Enterprises

Ventajas

Fácil de usar
Mucho más visual
Menos errores humanos
Soporte profesional

Inconvenientes

De pago
Menos control fino
Más consumo de recursos

Instalación y configuración

Actualización del sistema

Lo primero que haremos al tener lista la máquina (en el caso de que sea nueva), será actualizar el sistema y asegurarnos de que la máquina tenga red.

sudo apt update && sudo apt upgrade -y

Instalación de dependencias

Nagios Core se compila desde código fuente y necesitamos: servidor web (Apache), php para la interfaz web, herramientas de compilación y librerías para gráficos y plugins

sudo apt install -y autoconf gcc libc6 make wget unzip apache2 php libapache2-mod-php libgd-dev libssl-dev bc gawk dc build-essential snmp libnet-snmp-perl gettext

Configuración de usuarios y grupos

Nagios requiere un usuario propio para ejecutarse y permisos específicos para que el servidor web Apache pueda interactuar con él de forma segura.

Crear usuario: sudo useradd nagios
Crear grupo: sudo groupadd nagios
Vinculamos Apache: sudo usermod -a -G nagios www-data

Instalación de Nagios Core

Compilaremos Nagios desde el código fuente para garantizar la versión más estable y personalizada. Para la descarga y compilación usaremos los siguientes comandos:

cd /tmp
wget -O nagioscore.tar.gz https://github.com/NagiosEnterprises/nagioscore/archive/nagios-4.5.8.tar.gz
tar xzf nagioscore.tar.gz
cd nagioscore-nagios-4.5.8/

# Configuración e Instalación
sudo ./configure --with-httpd-conf=/etc/apache2/sites-enabled
sudo make all
sudo make install-groups-users
sudo make install
sudo make install-daemoninit
sudo make install-commandmode
sudo make install-config
sudo make install-webconf

Acceso a la interfaz web

Crea una contraseña para el usuario administrador (nagiosadmin):

sudo htpasswd -c /usr/local/nagios/etc/htpasswd.users nagiosadmin
sudo a2enmod cgi
sudo systemctl restart apache2

Instalación de Nagios Plugins

Nagios Core es el “motor”, pero los Plugins son las herramientas que realizan los chequeos (CPU, Disco, Ping). Para dicha instalación ejecutaremos los siguientes comandos.

cd /tmp
wget --no-check-certificate -O nagios-plugins.tar.gz https://github.com/nagios-plugins/nagios-plugins/archive/release-2.4.6.tar.gz
tar zxf nagios-plugins.tar.gz
cd nagios-plugins-release-2.4.6/

sudo ./tools/setup
sudo ./configure
sudo make
sudo make install

Definición de hosts locales y remotos

Una vez instalado Nagios, el siguiente paso es definir qué equipos vamos a monitorizar. En Nagios, todo comienza con la definición de un host.

Los hosts locales suelen estar definidos en el fichero localhost.cfg. Ejemplo:

define host {
    use linux-server
    host_name localhost
    alias Servidor Nagios
    address 127.0.0.1
}

Este host representa la propia máquina donde se ejecuta Nagios.

Host remotos

Para monitorizar otros servidores, definimos nuevos hosts. Ejemplo:

define host {
    use linux-server
    host_name servidor-web
    alias Servidor Web
    address 192.168.1.50
}

Nagios solo necesita conectividad con el host remoto; el método de monitorización dependerá del servicio configurado.

Métodos de monitorización remota

Ping: comprueba conectividad básica.
SSH: verifica que el servicio esté activo.
NRPE: ejecuta plugins en el host remoto (CPU, disco, RAM).

Ejemplo de servicio remoto usando NRPE:

define service {
    use generic-service
    host_name servidor-web
    service_description Carga del sistema
    check_command check_nrpe!check_load
}

Uso de hostgroups

Los hostgroups permiten escalar la configuración:

define hostgroup {
    hostgroup_name servidores-linux
    alias Servidores Linux
    members localhost,servidor-web
}

Verificación y pruebas

Para verificar que todo funciona, iniciamos el servicio:

sudo systemctl start nagios

¿Cómo aprender practicando?

Desde la máquina anfitrión, abrimos el navegador y escribimos la IP de su VM: http://[IP_DE_TU_VM]/nagios, nos pedirá las credenciales de administrador para entrar, y una vez que entremos estaremos ya en la página de inicio de Nagios.

inicio Nagios

Para configurar las alertas en Nagios, debemos trabajar principalmente en el archivo de configuración del host (por defecto /usr/local/nagios/etc/objects/localhost.cfg para la máquina local). Nagios funciona definiendo Servicios, cada servicio utiliza un comando y unos parámetros (separados por !). La estructura básica de estos comandos suele ser “check_command NOMBRE_COMANDO!parámetro1!parámetro2”

Ejemplo de monitorización de carga CPU (check_local_load):

Este comando no mide el “uso de CPU” (0-100%), sino la Carga del Sistema (Load Average), es decir, el número de procesos que están usando la CPU o esperando a que la CPU se libere.

Si tienes 1 CPU y la carga es 1.0, la CPU está perfectamente ocupada.
Si la carga es 2.0, la CPU está saturada y hay un proceso haciendo cola.

La estructura del comando (por defecto) es la siguiente:

check_command       check_local_load!5.0,4.0,3.0!10.0,6.0,4.0

El comando se divide en dos bloques separados por “!”, la primera parte afecta al warning, la segunda parte afecta al critical.

warning: avisa de un problema potencial.
critical: indica un problema real que requiere intervención inmediata.

Los números que encontramos en cada apartado son los límites máximos permitidos de carga, en orden 1m–5m–15m (orden fijo). Poniendo como ejemplo los valores por defecto, si en el primer minuto nuestra CPU alcanza una carga de 7 cuando por defecto está a 5 (7 > 5), Nagios entiende esto como warning, en el caso de que después la carga del sistema baje y sea menor que los siguientes valores (4.0 y 3.0), pasará de warning a OK, en el caso contrario de que la carga de CPU siga subiendo pasará a critical.

Estos valores pueden verse afectados dependiendo de los cores que tenga la máquina, es decir, la configuración por defecto estaría pensada para máquinas de entre 2 a 4 núcleos. Para ajustar los parámetros según los cores de la máquina podemos emplear la siguiente regla:

WARNING ≈ 0.7 × núcleos
CRITICAL ≈ 1.0–1.5 × núcleos

Ejemplo:

1 core

!0.7,0.5,0.3!1.5,1.2,1.0

4 cores

!3.0,2.5,2.0!5.0,4.0,3.5

Ejercicio para forzar el warning y el critical

Para entender cómo funciona el Load Average y cuándo Nagios cambia de estado podemos hacer uso de los siguientes comandos:

Podemos comprobar la carga actual del sistema usando uptime. Ejemplo: load average: 0.05, 0.03, 0.01
Para ver cuántos núcleos tiene la máquina haremos uso de nproc.
Podemos generar carga de CPU con el comando yes. Ejemplo: yes > /dev/null. Esto consume 1 core al 100% por lo que si nuestra máquina es de 1 core, al ejecutar uptime de nuevo podremos comprobar que estará en estado de warning. Si este proceso lo repetimos abriendo varios terminales, nuestra cpu pasará a critical.
Para acabar con el proceso yes usaremos pkill yes.

Ejemplo de monitorización de espacio en disco (check_local_disk):

check_local_disk compara el espacio total libre con un porcentaje, por defecto el valor suele ser “check_local_disk!20%!10%!/”.

El primer parámetro indica que si el espacio en el disco baja (en este caso de 20%), el estado pasa a warning.
El segundo parámetro indica que si el espacio en el disco baja (en este caso de 10%), el estado pasa a critical.
El tercer parámetro indica la ruta del disco. En Linux, / es el disco principal.

Ejercicio para forzar alerta de estado en disco

Para ver el estado disponible en disco hacemos uso de df -h /.
Podemos crear un fichero grande (1 Gb) usando: dd if=/dev/zero of=/tmp/testfile bs=1M count=1024. este comando lo podemos ir repitiendo para ir consumiendo espacio en disco y provocar la alerta.
Limpiamos en sistema ejecutando rm -f /tmp/testfile.

Ejemplo de monitorización del estado de la red (check_ping):

Envía paquetes de prueba ICMP. Ejemplo: check_ping!100.0,20%!500.0,60%.

El primer parámetro es el warning, se activa si el tiempo de respuesta es mayor a 100ms o si se pierde mas del 20% de los paquetes enviados.
El segundo parámetro es el critical, se activa si la respuesta tarda más de 500ms o se pierde más del 60% de la información.

Ejercicio para forzar critical en la red

Podemos bloquear temporalmente ICMP ejecutando iptables -A INPUT -p icmp –icmp-type echo-request -j DROP (como root), de esta forma ping empezará a fallar, cuando empiecen a perderse paquetes se pondrá en estado warning y pasará a critical cuando cuando la perdida sea alta.
Posteriormente para restaurar el estado de la red ejecutaremos iptables -D INPUT -p icmp –icmp-type echo-request -j DROP (como root)

Ejemplo de monitorización del servicio SSH (check_ssh):

Intenta realizar un “apretón de manos” (handshake) con el protocolo SSH en el puerto 22. Si el puerto está abierto y el servicio responde “OK”, si el puerto está cerrado o el servicio SSH se ha caído: CRITICAL. Por lo general no suele llevar parámetros en su forma base.

A diferencia con el Ping te dice que el “servidor está encendido” el SSH te dice que el “servicio de administración está funcionando”.

Ejemplo de monitorización de la memoria swap (check_local_swap):

La Swap es el espacio de intercambio en disco si Debian empieza a usar mucha Swap, es porque se ha quedado sin RAM física. En los parámetros que suelen ponerse suelen indicar el porcentaje de swap libre. Por ejemplo:

check_local_swap!20!10

En este caso la swap pasará a estado warning cuando le quede un 20% libre, mientras que si llega a 10% pasará a estado critical lo que indicara que el servidor estará a punto de “congelarse” o de empezar a cerrar programas por falta de memoria.

Ejercicio para detectar la falta de RAM

Podemos detectar la falta de memoria RAM.

Primero necesitamos instalar la herramienta de estres “apt install stress”.
Consumimos la memoria: stress –vm 2 –vm-bytes 512M
Observamos el uso de swap usando free -h, cuando la swap empiece a llenarse, cuando le quede un 20% de espacio libre debería de ponerse en estado warning, y al llegar a 10% debería de pasar a critical.
Una vez que hayamos hecho la prueba detenemos stress usando pkill stress.

Conclusión

Nagios es una herramienta potente para detectar problemas antes de que ocurran. La clave está en entender qué mide cada servicio, ajustar correctamente los umbrales y practicar provocando situaciones reales.

En mi caso, el aspecto que más me costó al montarlo fue ajustar los umbrales de carga de CPU correctamente: los valores por defecto estaban pensados para máquinas con más núcleos, y hasta que no hice los ejercicios con yes y uptime no terminé de entender la relación entre el load average y los núcleos disponibles.

Nagios Core tiene una curva de aprendizaje más pronunciada que herramientas como Zabbix o Grafana, pero esa misma “dureza” de configuración en ficheros de texto te obliga a entender realmente qué estás monitorizando y por qué. Para entornos donde se necesita control total y bajo consumo de recursos, sigue siendo una opción sólida.

Ver también

Si te interesa la monitorización, en este blog también puedes encontrar:

Share on

X Facebook LinkedIn Bluesky

Introducción a Nagios Core

Introducción

Ediciones de Nagios: Core y Nagios XI

Nagios XI

Instalación y configuración

Definición de hosts locales y remotos

Conclusión

Ver también

Share on

You May Also Enjoy

Supervisión y copia de seguridad de recursos

Configuración y administración de redes virtuales

Implementación y administración de recursos de proceso

Administración del almacenamiento