Cuando tenemos que monitorizar algún elemento, la pregunta siempre es la misma, sabemos de la importancia de monitorizar, pero... ¿Qué monitorizo? ¿Qué es lo importante?

Pues bien, aquí os exponemos que es aquello que nosotros, como expertos en monitorización, creemos que es básico tener controlado en una máquina que tenga un sistema operativo Linux.

Ping o disponibilidad

Lo primero que necesitamos saber es si la máquina está ‘viva’ y si hay buena comunicación con ella. Para ello podemos usar la función PING.

CPU

No importa mucho el porcentaje de CPU usado. Interesa más si hay procesos que la están utilizando de forma descontrolada por algún tipo de error.

A la hora de monitorizar la CPU hay que tener en cuenta un par de cosas:

  • Cuando se lanzan procesos periódicos que puedan consumir mucha CPU en un momento en concreto. Recuerda poner una excepción durante ese tiempo para no recibir alarmas.
  • Umbrales inferiores y superiores. Un uso excesivo de CPU puede ser un indicador de que hay algún problema, pero un uso escaso también lo será, ya que podría avisar que las aplicaciones o procesos no están en marcha.

Memoria

Conocer el uso de la memoria es igual de importante que con el caso del uso de la CPU, y lo es por los mismos motivos. Aquí estaría bien saber los valores de la memoria total de la máquina y la que se está usando.

Fichero de paginación (SWAP)

La memoria swap es donde los sistemas operativos cargan información cuando esta no cabe en la memoria de la máquina. Es relevante tener controlada la cantidad de memoria swap para saber en todo momento si se dispone de la necesaria.

Uptime o tiempo desde el último inicio de sistema

Conocer cuanto tiempo lleva la máquina en marcha nos sirve para ver si ha habido algún reinicio. Estos reinicios no voluntarios son a causa de problemas. También es bueno saber si una máquina lleva mucho tiempo sin reiniciarse, cosa que se aconseja hacer de forma periódica.

Hora del servidor contra la hora del dominio

Una máquina que está en el Dominio de la organización no se puede atrasar o adelantar respeto a la hora oficial, ya que esto acarrea múltiples problemas.

Filesystems

Las máquinas Linux cuentan con diferentes ‘filesystems’ y hay que saber cuando estos se quedan sin espacio. Estaría bien tener un check por cada filesystem que tenga la máquina.

Servicio “Cron”

El servicio de Cron se utiliza en Linux para programar ejecuciones de tareas. Si este se detiene, las tareas no se realizan. Por ello hay que saber si el servicio está arrancando.

Servicio de monitorización

En la mayoría de los casos, para monitorizar una máquina Linux se usará el protocolo SSH y se hará a través del puerto 22 TCP que usa este protocolo. Si se quiere estar seguro de que se puede ejecutar la monitorización sobre esta máquina, hay que saber que este puerto es accesible.

Versión de Linux instalada

Conocer la versión de Linux que hay instalada puede ser útil por muchos motivos, entre ellos:

  • Saber que máquinas hay que actualizar cuando sale un parche nuevo en una de las versiones de Linux.
  • Saber que máquinas van a quedarse sin soporte del fabricante y/o llegan a su EOL.
  • Crear filtros en la herramienta de monitorización.

Tener monitorizado este dato ahorra entrar en la máquina a consultarlo.

¿Quieres empezar a monitorizar en Linux?

Hay infinidad de parámetros en Linux que se pueden monitorizar. Nos hemos centrado en los que consideramos esenciales para una buena monitorización.

Como expertos en monitorización podemos ayudarte con los servidores Linux de tu organización. Trabajamos desde una monitorización básica hasta una de más profunda y detallada, tanto como necesites.