¿Puede el aprendizaje automático ayudar en la detección de malware? ¿Cuáles son los cuellos de botella en tal implementación de ML?

Nuestro objetivo es detectar malwares mediante el aprendizaje automático. Es una detección de dos niveles:

  • Enfoque supervisado para detectar flujos maliciosos e identificar tipos específicos
  • Aprendizaje combinado no supervisado con aprendizaje supervisado para abordar un nuevo problema de descubrimiento de clases.

El marco de detección de malware de dos niveles se puede dividir como:

  • Clasificador de nivel macro: se utiliza para aislar el flujo malicioso de los flujos no maliciosos.
  • Clasificador de nivel micro: el flujo malicioso se clasifica además como uno de los malwares preexistentes de un malware recién descubierto.

El diagrama de bloques es el siguiente:

El proceso de clasificación ocurre de la siguiente manera:

  • Algoritmos ML
  • Clasificador aleatorio de bosque
  • Árbol de decisión J 48 impulsado
  • KNN, Naive-Bayes, SVM, Perceptrón Multicapa (MLP)
  • Algoritmo de detección básico de ID de correo

Tanto el método de Bayes como el clasificador de bosque aleatorio producen resultados satisfactorios, pero los árboles de decisión J48 potenciados son los mejores

Evaluación experimental :

Cuello de botella: el proceso de detección de malware mediante el aprendizaje automático requiere una gran cantidad de datos y, por lo tanto, a menudo se aplican métodos codificados para mejorar la eficiencia

More Interesting

¿Dónde puedo encontrar un conjunto de datos de texto traducido de cualquier idioma a otro válido para ser entrenado en un modelo de traducción automática en aprendizaje automático?

¿Cuál es una buena manera de entender esta optimización mediante el uso de un multiplicador lagrangiano?

¿Qué lenguaje de programación se usa para el aprendizaje automático?

¿Cuáles son ejemplos cuando es útil generar muestras a partir de un modelo probabilístico?

¿Qué piensa la gente del siguiente documento que señala los límites del aprendizaje de extremo a extremo?

¿Qué es más exigente, desarrollo de aplicaciones, aprendizaje automático, aprendizaje profundo, inteligencia artificial o IOT?

¿Cuándo debo usar la asignación de Dirichlet latente en la minería de texto? ¿Es bueno usarlo para un sistema que requiere alta precisión, como un sistema de detección de fraude?

Si una red de alimentación directa de una sola capa es capaz de aproximarse a cualquier grado de precisión, ¿por qué es exitoso el aprendizaje profundo?

Cómo convertirse en un cerebro cuant (un quant que usa IA)

¿Cómo se hace el cambio de C ++ a Python? Me siento más cómodo con C ++ y lo he estado usando para hacer la mayor parte de mi programación; Me parece que lleva mucho tiempo y Python hace las cosas rápidamente. ¿Cuál es la mejor manera de hacer el cambio?

En el aprendizaje profundo, ¿son el "aprendizaje incremental" y el "aprendizaje de transferencia" el mismo enfoque?

¿Qué nivel de experiencia en aprendizaje automático se espera de un científico de datos?

¿Cuáles son algunos ejemplos del uso del aprendizaje automático en sistemas distribuidos?

¿Existe un puntaje general de 'utilidad' para el rendimiento de recuperación de información?

¿Cómo está estudiando Conner Davis el aprendizaje automático?