informatica:linux:nagios
Differences
This shows you the differences between two versions of the page.
Both sides previous revisionPrevious revisionNext revision | Previous revisionNext revisionBoth sides next revision | ||
informatica:linux:nagios [2011/01/17 08:21] – 127.0.0.1 | informatica:linux:nagios [2011/01/24 19:17] – 127.0.0.1 | ||
---|---|---|---|
Line 1: | Line 1: | ||
nagios nagios3 monitorizacion smp http | nagios nagios3 monitorizacion smp http | ||
+ | |||
Line 7: | Line 8: | ||
====== Nagios ====== | ====== Nagios ====== | ||
- | nagios monitorizacion nagios3 | + | nagios monitorizacion nagios3 |
+ | |||
+ | http:// | ||
Es una herramienta de monitorización tanto de recursos privados | Es una herramienta de monitorización tanto de recursos privados | ||
Line 16: | Line 19: | ||
sudo aptitude update && sudo aptitude install nagios3 | sudo aptitude update && sudo aptitude install nagios3 | ||
+ | |||
Line 38: | Line 42: | ||
cfg_dir=/ | cfg_dir=/ | ||
+ | |||
+ | **IMPORTANTE** | ||
+ | |||
+ | 1. Se pueden crear subdirectorios en / | ||
+ | |||
+ | 2. Todos los archivos de configuración tienen que acabar en .cfg | ||
===== Anfitrión ===== | ===== Anfitrión ===== | ||
Line 43: | Line 53: | ||
Por ejemplo creamos el siguiente archivo: | Por ejemplo creamos el siguiente archivo: | ||
- | | + | |
Con el siguiente contenido: | Con el siguiente contenido: | ||
Line 54: | Line 64: | ||
address maquina1.mine.nu ; | address maquina1.mine.nu ; | ||
} | } | ||
+ | </ | ||
Grabamos y salimos. | Grabamos y salimos. | ||
- | |||
- | |||
- | </ | ||
===== Contacto ===== | ===== Contacto ===== | ||
Line 155: | Line 163: | ||
- | ===== Monitorizar los servicios locales de una máquina remote: NRPE ===== | ||
- | **EN CONSTRUCCIÓN** | ||
- | nagios nrpe | ||
- | nagios.sourceforge.net/ | + | ===== Monitorizar los servicios locales de una máquina remote: |
- | 1. En la máquina remota: | + | http:// |
- | aptitude update && aptitude install nagios xinetd nagios-nrpe-server netstat nagios-nrpe-plugin | + | 1. En la maquina local (la que tiene instalada nagios): |
- | + | ||
- | 1.1 Introducir | + | |
- | A mi me da algún error: | + | Instalar nrpe-plugin: |
- | < | + | sudo aptitude update && sudo aptitude install nagios-nrpe-plugin |
- | ...Starting nagios3 monitoring daemon: nagios3grep: | + | |
- | shift: 236: can't shift that many | + | |
- | unable to determine nagios_check_command from / | + | |
- | . | + | |
- | Setting up nagios3-core (3.2.0-4) ... | + | |
- | grep: / | + | |
- | shift: 236: can't shift that many | + | |
- | Starting nagios3 monitoring daemon: nagios3grep: | + | |
- | shift: 236: can't shift that many | + | |
- | unable to determine nagios_check_command from / | + | |
- | ... | + | |
- | </ | + | |
- | De momento funciona.... | + | Echarle un ojo a este archivoÑ |
- | 2. Configurar NRPE como servicio bajo xinet (a mi me casca) o como demonio (me furrula) | + | / |
- | * Como servicio | + | Reiniciar el servicio: |
- | 2.1.1 Crear: | + | sudo /etc/init.d/nagios3 restart |
- | nano /etc/xinetd.d/nrpe | + | 2. En la máquina remota: |
- | Con el siguiente contenido: | + | Instalar nrpe (y plugins): |
- | < | + | sudo aptitude update && sudo aptitude install |
- | service nrpe | + | |
- | { | + | |
- | flags = REUSE | + | |
- | socket_type = stream | + | |
- | wait = no | + | |
- | user = nagios | + | |
- | server = /usr/sbin/nrpe | + | |
- | server_args = -c /etc/nagios/ | + | |
- | log_on_failure += USERID | + | |
- | disable = no | + | |
- | # Ip de la máquina donde corre nagios | + | |
- | only_from = 127.0.0.1 maquina_nagios.mine.nu | + | |
- | } | + | |
- | </ | + | |
- | 2.1.2 Grabar y salir | + | Crear archivo de configuración: |
- | 2.1.3 Editar: | + | |
- | + | ||
- | nano / | + | |
- | + | ||
- | Y añadir la siguiente linea: | + | |
- | + | ||
- | nrpe 5666/tcp # NRPE | + | |
- | + | ||
- | 2.1.4 Grabar y salir | + | |
- | + | ||
- | 2.1.5 Comprobar si nrpe está corriendo como demonio: | + | |
- | + | ||
- | ps ax | grep nrpe | + | |
- | 22573 ? Ss 0:00 / | + | |
- | + | ||
- | Si es así, matar el proceso: | + | |
- | + | ||
- | kill -9 22573 | + | |
- | + | ||
- | 2.1.6 Arranco xinetd: | + | |
- | + | ||
- | / | + | |
- | + | ||
- | 2.1.7 Comprobar que el servicio nrpe está corriendo bajo xinetd: | + | |
- | + | ||
- | netstat -at | grep nrpe | + | |
- | + | ||
- | tcp 0 0 *: | + | |
- | + | ||
- | 2.1.8 Comprobar, mediante nagios, lo mismo: | + | |
- | + | ||
- | / | + | |
- | + | ||
- | NRPE v2.12 | + | |
- | + | ||
- | **ERROR** Cuando intento conectarme remotamente: | + | |
- | + | ||
- | / | + | |
- | + | ||
- | CHECK_NRPE: Error - Could not complete SSL handshake. | + | |
- | + | ||
- | No tengo ... de depurarlo. | + | |
- | + | ||
- | * Como demonio | + | |
- | + | ||
- | 2.1.1 (Opcional) Deshabilitar el servicio nrpe bajo xine | + | |
- | + | ||
- | 2.1.1.1 Editar: | + | |
- | + | ||
- | nano / | + | |
- | + | ||
- | Y dejar la linea tal que asi: | + | |
- | + | ||
- | disable = yes | + | |
- | + | ||
- | 2.1.1.2 Reiniciar xinet: | + | |
- | + | ||
- | / | + | |
- | + | ||
- | 2.1.1.3 Comprobar que no hay ningún servicio nrpe: | + | |
- | + | ||
- | netstat -at | grep nrpe | + | |
- | + | ||
- | No debería mostrar nada por pantalla | + | |
- | + | ||
- | 2.1.2 Dar acceso a la máquina remota al demonio nrpe: | + | |
- | + | ||
- | nano / | + | |
- | + | ||
- | Y dejar la linea tal que así: | + | |
- | + | ||
- | allowed_hosts=127.0.0.1, | + | |
- | + | ||
- | 2.1.3 Grabar y salir | + | |
- | + | ||
- | 2.1.4 Arrancar nrpe como demonio: | + | |
- | + | ||
- | / | + | |
- | + | ||
- | 2.1.5 Comprobar que se arrancó correctamente: | + | |
- | + | ||
- | ps ax | grep nrpe | + | |
- | + | ||
- | 26492 ? Ss 0:00 / | + | |
- | + | ||
- | 3. (OPCIONAL) Permitir al cortafuegos de la máquina remota que deje pasar tráfico por el puerto TCP 5666: | + | |
- | + | ||
- | | + | |
- | + | ||
- | 4. (OPCIONAL) Si la máquina está detrás de un router, hay que mapear el puerto 5666 tcp a la ip local que tenga esa máquina | + | |
- | + | ||
- | 5. En la máquina local donde ya está corriendo nagios, instalar el plugin de nrpe: | + | |
- | + | ||
- | | + | |
- | + | ||
- | 6. Intentar averiguar si el servicio/ | + | |
- | + | ||
- | / | + | |
- | + | ||
- | NRPE v2.12 | + | |
- | + | ||
- | 7. (En la máquina remota) Crear el siguiente archivo: | + | |
- | + | ||
- | nano / | + | |
- | + | ||
- | Con el siguiente contenido: | + | |
- | + | ||
- | command[comprobar_noexiste]=/ | + | |
- | + | ||
- | Este comando comprueba si al menos hay una instancia del proceso ' | + | |
- | + | ||
- | 8. Grabar y salir | + | |
- | + | ||
- | 9. (Opcional) si estamos corriendo nrpe como demonio, hay que matar el proceso y volver a lanzarlo | + | |
- | + | ||
- | 10. (En la máquina local donde está corriendo nagios) Añadir un servicio: | + | |
- | + | ||
- | nano / | + | |
Con el siguiente contenido: | Con el siguiente contenido: | ||
< | < | ||
- | define service{ | + | allowed_hosts=monitor.jj.com |
- | | + | command[check_disk]=/usr/ |
- | contacts | + | |
- | host_name | + | |
- | service_description | + | |
- | use | + | |
- | } | + | |
</ | </ | ||
- | 11. Reiniciar nagios | + | En este caso habilitamos |
- | + | ||
- | / | + | |
- | + | ||
- | Al cabo de 4 alertas, debería enviar un correo. | + | |
- | + | ||
- | **ERRORES** | + | |
- | + | ||
- | * **Error: NRPE daemon cannot be run as user/group root!** | + | |
- | + | ||
- | Hemos reiniciado xinetd: | + | |
- | + | ||
- | / | + | |
- | + | ||
- | Y hemos intentado arrancar a mano nrpe como un servicio bajo xinetd: | + | |
- | + | ||
- | / | + | |
- | + | ||
- | Vemos que no arranca | + | |
- | + | ||
- | ps ax | grep nrpe | + | |
- | + | ||
- | Y vemos el log de sistema: | + | |
- | + | ||
- | clear && cat / | + | |
- | + | ||
- | **Solución**: | + | |
- | + | ||
- | 1. Asegurarnos que en el archivo: | + | |
- | + | ||
- | nano / | + | |
- | + | ||
- | Existe la siguiente directiva: | + | |
- | + | ||
- | user = nagios | + | |
- | + | ||
- | Y que, lógicamente, | + | |
- | + | ||
- | 2. Reiniciar xinetd: | + | |
- | + | ||
- | / | + | |
- | + | ||
- | * **bind failed (Address already in use (errno = 98)). service = nrpe** | + | |
- | + | ||
- | No arranca el servicio nrpe porque el puerto (ver el puerto asociado a ' | + | |
- | + | ||
- | lsof -ni :5666 | + | |
- | + | ||
- | COMMAND | + | |
- | nrpe 2478 nagios | + | |
- | + | ||
- | **Solución** | + | |
- | + | ||
- | 1. Matar el proceso que estorba: | + | |
- | kill -9 2478 | + | **RECOMENDADO**: |
- | 2. Reiniciar xinetd: | + | sudo vim / |
- | / | + | Reiniciar el servicio: |
- | | + | |
- | **Solución**: | + | 3. Probarlo. Desde la máquina local: |
- | 1. En la máquina remota mapear en el router el puerto 5666 tcp a la ip local de esa máquina | + | Para probar que nrpe este arriba: |
- | 2. (Opcional) reiniciar el router para que los cambios surtan efecto | + | / |
- | * **CHECK_NRPE: Error - Could not complete SSL handshake.** | + | Para probar el comando antes habilitado: |
- | * **CHECK_NRPE: | + | |
- | * **CHECK_NRPE: | + | |
- | **Solución** Separar por comas las direcciones o nombres dentro de la directiva ' | + | |
===== Ejemplo: comprobar si una máquina está levantada ===== | ===== Ejemplo: comprobar si una máquina está levantada ===== |
informatica/linux/nagios.txt · Last modified: 2015/04/13 20:19 by 127.0.0.1