top of page

Aprendizaje automático para la ciberseguridad

Detección de anomalias

La detección de anomalías es la identificación de eventos en un conjunto de datos que no se ajustan al patrón esperado. En aplicaciones prácticas, estos eventos pueden ser de importancia crítica. Por ejemplo, pueden representar intrusiones en la red o fraudes. Utilizaremos Isolation Forest para detectar tales anomalías.

 

Isolation Forest es un algoritmo de aprendizaje automático similar al algoritmo de Random Forest ya que utiliza un conjunto de árboles de decisión, donde el objetivo de cada árbol es aislar observaciones. El algoritmo funciona bajo la premisa de que las anomalías

(puntos atípicos) están más alejadas del resto de los datos, por lo que se pueden aislar con menos particiones.

 

    1. Construcción del árbol: Se seleccionan aleatoriamente características y puntos de corte en cada nodo de los árboles.

    2. Aislamiento: Los puntos que son atípicos o anómalos tienden a ser aislados más rápidamente (con menos divisiones). Las                          observaciones normales, por otro lado, requieren más particiones para ser aisladas.

    3. Puntuación de anomalía: La anomalía de un punto se mide en función del número de particiones necesarias para aislarlo. Si un                  punto se aísla con pocas particiones, es más probable que sea una anomalía.

Google colab:

bottom of page