Cómo lidiar con direcciones IP en algoritmos de aprendizaje automático en análisis de tráfico y detección de anomalías

La siguiente es una copia de mi respuesta en Cross Validated . Si bien no aborda el aspecto de las direcciones IP (sin juego de palabras), tiene algunas referencias potencialmente valiosas a materiales sobre temas de aprendizaje automático en análisis de tráfico y detección de anomalías. Espero que lo encuentres útil.

Definitivamente no soy un experto en detección de anomalías . Sin embargo, es un área interesante y aquí están mis dos centavos. Primero, teniendo en cuenta su nota de que “la distancia de Mahalanobis solo se puede aplicar a entidades distribuidas normalmente”. Me encontré con algunas investigaciones que argumentan que todavía es posible usar esa métrica en casos de datos no normales . Eche un vistazo a este documento y este informe técnico.

También espero que encuentre útiles los siguientes recursos sobre detección de anomalías no supervisadas (AD) en el contexto de seguridad de la red de TI , utilizando diversos enfoques y métodos: este documento, que presenta un marco geométrico para AD sin supervisión; este documento, que utiliza un enfoque de agrupamiento basado en densidad y en cuadrícula ; diapositivas de esta presentación, que mencionan el uso de mapas autoorganizados para AD.
Cómo acceder a otra computadora si conoce la dirección IP de esa computadora y se conecta en una red diferente
¿Cuál es la dirección IP .100.2?
¿Por qué 192.168.1.1 no funciona recientemente cuando intento configurar los ajustes de mi enrutador?
Cómo extender el tráfico de un servidor que viene de un cliente a otra IP '
¿Cuál es la diferencia entre una dirección IP privada y una dirección IP pública?

Finalmente, le sugiero que eche un vistazo a las siguientes respuestas mías, que creo que son relevantes para el tema y, por lo tanto, podrían ser útiles: respuesta sobre enfoques de agrupación, respuesta sobre agrupación no basada en la distancia y respuesta sobre opciones de software para ANUNCIO.

¿Qué es una dirección MAC y cómo la cambio?

¿Cómo puede alguien en la red Tor rastrear mi dirección IP incluso si estoy usando Tor, una VPN y TAILS?

Cómo localizar la dirección de una persona que me ha enviado una carta muy incómoda (a punto de amenazar), sin una dirección de devolución

Cómo encontrar a alguien por su dirección IP

¿Cuáles son algunos ejemplos de cómo se aplica la ciencia de datos en la inversión?

Cómo explicar sobre la dirección IP y el servidor a un niño de clase 5

No estoy seguro de cuál es el problema objetivo, pero estoy presentando algunas de mis sugerencias para usar la dirección IP para la extracción de funciones en ML

[1] Extraiga la ubicación geográfica de la IP. Cómo hacerlo en Java. Utilice GeoLocation como entrada para su aprendizaje automático

[2] Utilice la clase de dirección IP como tipo de característica

[3] El patrón de bits o la cadena convertida en base64 se pueden tratar como un valor de característica

Aleksandr Blekh

Esta no es mi área de especialización, pero si cada dirección IP no está relacionada con otras direcciones IP de la misma subred, debe modelarlas como entidades discretas. Una forma es hacer una codificación de un solo uso como usted menciona, pero si el espacio es demasiado grande, es posible que desee usar una función hash para proyectar primero a un espacio más pequeño, digamos 16 bits. Probablemente no necesite preocuparse demasiado por colisiones para sus propósitos, a menos que el número de direcciones IP sea muy grande.

Dmitriy Genzel

More Interesting

¿Necesito una IP estática para alojar mi sitio web?

¿Cuáles son los malos usos de la dirección IP?

¿Cuál es la diferencia entre DNS y una dirección IP?

¿Qué sucede si cambio mi IP estática?

Si todos los estudiantes en una red inalámbrica de la universidad tienen la misma dirección IP externa, ¿pueden las compañías como Google saber quién envió una búsqueda o solicitud?

¿Cuáles son algunas de las direcciones IPv6 más atractivas?

Mi nombre ha sido empañado en un sitio web, en un comentario. ¿Cómo puedo averiguar la dirección IP del comentarista si tomo medidas legales?

¿Puede un televisor inteligente conectado a WiFi no tener una dirección IP?

¿Tenemos una dirección IP única en nuestro dispositivo? En otras palabras, ¿4.300 millones de direcciones IP que nunca se han usado todas a la vez o, a veces, incluso más usuarios?

¿Es posible bloquear las direcciones IP de países enteros?