Monitorización, Nagios Core / XI , OP5 Monitor & Naemon

Síguenos también en @SIM_Technical

Introducción a OP5 Monitor 5/8: Procesos de negocio

Hasta ahora en estas prácticas con OP5 Monitor hemos aprendido a añadir equipos, servicios, y visualizar estos en el GeoMap. Todo esto está muy bien, es vistoso y nos puede venir perfecto para el trabajo diario, pero no podemos pasar por alto que aún nos vendría mejor la definición de procesos de negocio, y hoy vamos a ver esta herramienta de OP5 Monitor que realmente esta genial.

Primero vamos a definir que es un proceso de negocio.

Un proceso de negocio es una relación de elementos (equipos y/o servicios), y que al final nos devuelven si ese proceso está funcionando correctamente o no.

Imaginemos por ejemplo nuestro caso, Solucions-IM. Hasta ahora hemos monitorizado dos equipos (hosts) que son los dos dominios y todos sus servicios. Pero esto no define si Solucions-IM está realmente funcionado, no desde un punto de vista técnico, si no desde un punto de vista funcional. Vamos a definir primero el proceso de negocio Solucions-IM:
– Funciona si los dos hosts están disponibles (solucions-im.com y solucions-im.net).
– Funciona si la web principal está respondiendo.
– Funciona si la web de cliente está respondiendo.
– Funciona si la base de datos de clientes está respondiendo.

Des de un punto de vista funcional, como podéis ver no se trata si todo está en “verde” si no que estos servicios estén arriba.

Cuando los responsables nos piden el estado de un servicio no se refieren a un elemento concreto, si no que quieren saber la disponibilidad de una aplicación o proceso de negocio.

Lo destacable de OP5 Monitor es la gran variedad de opciones (condiciones) que nos permite usar para definir nuestro proceso de negocio.

Vamos con nuestro ejemplo y luego comentamos el resto de opciones.

Empezamos accediendo al icono de “Monitoring” y posteriormente pinchamos en “Business services”.

op5_5_1

Como podéis observar ya tenemos un proceso de negocio configurado. Podemos ver el tipo de norma (o condición) que se aplica, los botones de acción, y el disco que nos permite guardar los cambios. Es importante que a medida que realizamos cambios los vayamos guardando.

op5_5_2

Lo primero que haremos es eliminar este proceso de negocio. Le pinchamos en la acción “delete”, le confirmaremos cuando nos pregunte y guardamos los cambios.
Ahora pasamos a crear el proceso de negocio que hemos definido anteriormente. Le damos a “New Business Service” y nos aparece la siguiente pantalla.

op5_5_4

Aquí tenemos muchas condiciones a escoger para nuestro proceso de negocio, pero en nuestro caso vamos a escoger “Worst state” que lo que nos devolverá como estado del proceso el peor resultado que tengamos en los subprocesos. Si todos los subprocesos están OK nos devolverá OK, solo que tengamos un WARNING será WARNING y con un solo CRITIC será estado CRITIC en el proceso de negocio.
A continuación le ponemos un nombre, no lo asociamos con ningún servicio ni nada y guardamos los cambios al volver a la pantalla principal. Nos debería aparecer con estado desconocido, pues simplemente hay el nombre.

op5_5_5

Como podemos ver nos parece ahora una pantalla muy parecida a la anterior (cuando creamos el proceso) pero con más opciones ahora. Si nos fijamos podemos deducir además que podemos crear subprocesos de subprocesos (creo que aquí está la fuerza de OP5 Monitor). En la práctica que llevamos en marcha por eso solo crearemos “Service” y “Host”.

op5_5_6

Añadimos todos los servicios y equipos que habíamos definido con anterioridad. Al final deberíamos tener un proceso de negocio parecido a esto:

op5_5_7

Como se puede observar, como que la condición general es que el estado del proceso es el peor estado de todo lo definido por debajo, lo tenemos en WARNING por que el tiempo de espera de la web de Solucions-IM está por encima del valor considerado normal.

No tenemos límite en la construcción de nuestros procesos, y podemos poner tantos como queramos, pero a continuación vamos a ver los elementos que podemos usar como condiciones:
– Número de estados fallidos en subelementos. Por ejemplo le podríamos decir que el proceso de negocio sea WARNING si hay 2 estados no OK por debajo o CRITICAL si hay 3 elementos no OK.
– Le podemos decir que nos devuelva el peor valor en el proceso de negocio (es el que hemos utilizado en la práctica).
– También le podemos decir que nos devuelva el mejor estado de los subelementos. Este va bien si disponemos de un clúster por ejemplo, ya que si uno de los dos equipos esta OK el estado del servicio es OK.
– Podemos definir un % de subprocesos para que nos dé OK o WARNING. Por ejemplo tenemos una granja de 10 servidores, si tenemos 6 caídos (60%) que sea WARNING.
– Podemos poner también un % para definir el estado crítico, lo usaríamos como en el caso anterior.
– Podemos además poner también, cualquier host con todos sus servicios, hosts específicos o servicios específicos (como hemos visto en la práctica), incluso podemos poner grupos de hosts o servicios.
– Podemos ponerle constantes y objetos con valores aleatorios. ¿Para qué sirve esto? Buena pregunta. Nosotros lo usamos para control o test del proceso de control. Por ejemplo podemos poner un objeto llamado FALLO ALEATORIO del tipo “Random” así podemos controlar que el proceso está funcionando correctamente sin necesidad de hacer caída del servicio.

Repetimos una vez más, que la gracia de OP5 Monitor es que todos estos elementos se pueden combinar hasta encontrar la configuración deseada.

Nos nos vemos hasta el 2014!! Buena entrada de año a tod@s!!!

, , , , ,

Deja un comentario

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.