¿Puede el aprendizaje automático ayudar en la detección de malware? ¿Cuáles son los cuellos de botella en tal implementación de ML?

Nuestro objetivo es detectar malwares mediante el aprendizaje automático. Es una detección de dos niveles:

Enfoque supervisado para detectar flujos maliciosos e identificar tipos específicos
Aprendizaje combinado no supervisado con aprendizaje supervisado para abordar un nuevo problema de descubrimiento de clases.

El marco de detección de malware de dos niveles se puede dividir como:

Clasificador de nivel macro: se utiliza para aislar el flujo malicioso de los flujos no maliciosos.
Clasificador de nivel micro: el flujo malicioso se clasifica además como uno de los malwares preexistentes de un malware recién descubierto.

El diagrama de bloques es el siguiente:

El proceso de clasificación ocurre de la siguiente manera:

Algoritmos ML
Clasificador aleatorio de bosque
Árbol de decisión J 48 impulsado
KNN, Naive-Bayes, SVM, Perceptrón Multicapa (MLP)
Algoritmo de detección básico de ID de correo

Tanto el método de Bayes como el clasificador de bosque aleatorio producen resultados satisfactorios, pero los árboles de decisión J48 potenciados son los mejores

Evaluación experimental :

Cuello de botella: el proceso de detección de malware mediante el aprendizaje automático requiere una gran cantidad de datos y, por lo tanto, a menudo se aplican métodos codificados para mejorar la eficiencia

Aprendizaje automáticoInteligencia ArtificialMalware

Related Content

¿Cuál es más eficiente para los algoritmos de reconocimiento facial, PCA o LDA?

¿Cómo construye Apple su red neuronal para el nuevo iPhone X Face ID? Los usuarios solo registran sus caras una vez cuando configuran el teléfono inicialmente, entonces, ¿cómo podría esa foto de los usuarios ser un conjunto de entrenamiento lo suficientemente grande como para entrenar la red neuronal?

¿Cuáles son algunas ideas importantes / brillantes en el aprendizaje automático?

¿Cómo decidimos qué algoritmo usar en el aprendizaje automático?

¿Qué enfoques / regulaciones se utilizan para manejar el 'problema mínimo / máximo local' cuando se usa el descenso de gradiente con redes neuronales profundas?

¿Pueden las personas con IQ (100) promedio dominar el aprendizaje automático y el aprendizaje profundo?

¿Cuáles son algunos problemas de Kaggle que ayudarán a un principiante a avanzar?

More Interesting

¿Dónde puedo encontrar un conjunto de datos de texto traducido de cualquier idioma a otro válido para ser entrenado en un modelo de traducción automática en aprendizaje automático?

¿Cuál es una buena manera de entender esta optimización mediante el uso de un multiplicador lagrangiano?

¿Qué lenguaje de programación se usa para el aprendizaje automático?

¿Cuáles son ejemplos cuando es útil generar muestras a partir de un modelo probabilístico?

¿Qué piensa la gente del siguiente documento que señala los límites del aprendizaje de extremo a extremo?

¿Qué es más exigente, desarrollo de aplicaciones, aprendizaje automático, aprendizaje profundo, inteligencia artificial o IOT?

¿Cuándo debo usar la asignación de Dirichlet latente en la minería de texto? ¿Es bueno usarlo para un sistema que requiere alta precisión, como un sistema de detección de fraude?

Si una red de alimentación directa de una sola capa es capaz de aproximarse a cualquier grado de precisión, ¿por qué es exitoso el aprendizaje profundo?

Cómo convertirse en un cerebro cuant (un quant que usa IA)

¿Cómo se hace el cambio de C ++ a Python? Me siento más cómodo con C ++ y lo he estado usando para hacer la mayor parte de mi programación; Me parece que lleva mucho tiempo y Python hace las cosas rápidamente. ¿Cuál es la mejor manera de hacer el cambio?

En el aprendizaje profundo, ¿son el "aprendizaje incremental" y el "aprendizaje de transferencia" el mismo enfoque?

¿Qué nivel de experiencia en aprendizaje automático se espera de un científico de datos?

¿Cuáles son algunos ejemplos del uso del aprendizaje automático en sistemas distribuidos?

¿Existe un puntaje general de 'utilidad' para el rendimiento de recuperación de información?

¿Cómo está estudiando Conner Davis el aprendizaje automático?

Web Analytics