¿Puede el aprendizaje profundo manejar datos desequilibrados?

Si. El desequilibrio de clase suele ser un desafío para muchos modelos de aprendizaje automático, pero hay una serie de métodos ampliamente aplicables que pueden mejorar las métricas de clasificación como recordar, F1 y AUC ROC. Tenga en cuenta que en los enfoques enumerados a continuación no hay nada específico de algoritmo, por lo que sin duda se puede utilizar para mejorar los resultados de los modelos de aprendizaje profundo.

Muestreo : sobremuestreo de una clase minoritaria, submuestreo de la clase mayoritaria o incluso generar nuevas muestras con una técnica como SMOTE.
Ponderación de la función de costo : puede asignar pesos a las etiquetas de su clase de modo que la función de costo penalice la pérdida en ciertas clases con mayor severidad. Esto puede hacer que el modelo se adapte mejor a las características de una clase minoritaria.
Ajuste del umbral de decisión : una vez que haya pronosticado las probabilidades, en lugar de utilizar una decisión predeterminada de más del 50% para asignar etiquetas pronosticadas, puede intentar reducir el umbral para mejorar la recuperación de una clase minoritaria / optimizar F1.

Al igual que con otras opciones de modelado, el uso de estos métodos y sus parámetros deben validarse de forma cruzada.

Incluso diría que en algunos dominios, el aprendizaje profundo es especialmente adecuado para clases desequilibradas. Por ejemplo, con los datos de imagen es común aumentar el conjunto de datos realizando rotaciones, cizallas, volteretas, etc., por lo que hay una forma muy natural de agregar observaciones sintéticas de una clase minoritaria.

Deep LearningMachine Learning

Related Content

¿Qué es una capa de disminución de resolución en la red neuronal convolucional (CNN)?

¿Es la informática de alto rendimiento un conocimiento esencial para el aprendizaje profundo dado que se trata de una gran red neuronal?

¿Qué implica el e-Discovery?

¿Cuál es la diferencia entre AODE y una red bayesiana?

¿Dónde puedo encontrar una biblioteca pública de algoritmos de aprendizaje automático (ML) y aprendizaje profundo (DL) con muestras?

¿Cuáles son los roles de probabilidad y estadística en el aprendizaje automático? ¿Qué tan importantes son? ¿Cuáles son sus aplicaciones en el aprendizaje automático?

¿Cuál es el mejor curso para especializarse en inteligencia artificial y aprendizaje automático?

Puede, pero los resultados no serán tan precisos en datos nuevos.

Cada vez que tiene que fabricar datos para modelar, introduce sesgo.

Sin embargo, la mayoría de los conjuntos de datos tabulares del mundo real están llenos de agujeros, por lo que muchas veces es necesario completarlos.

Si está interesado en aprender algunos de los algos más comunes utilizados en el aprendizaje automático, consulte este curso gratuito.

Una introducción al aprendizaje automático para ingenieros de datos

Mike West

Sí, Deep Learning puede manejar datos desequilibrados, pero la característica clave de DL es la ingeniería automática de características, que requiere una gran cantidad de datos etiquetados e información de expertos en dominios. Esto se hace mediante el diseño de características que miden la diferencia entre los datos actuales y los datos históricos. Los datos etiquetados hacen que sea mucho más fácil para el sistema detectar patrones y fallas en conjuntos de datos dados.

Mike West

More Interesting

¿Puedo usar algoritmos y bibliotecas ML para empresas?

¿Qué funciona mejor: Autoencoder Variacional o Redes Adversarias Generativas?

¿Qué tan bueno es el programa de maestría en visión por computadora de la Universidad Autónoma de Barcelona en términos de contenido, costo y futura carrera (directamente trabajo o doctorado)?

¿Cuál es el mejor foro de red neuronal en Internet?

¿Podemos construir una máquina de visualización de sueños usando el procesamiento de señales?

En una unidad LSTM, ¿cuál es la razón detrás del uso de una activación de tanh?

¿Cuál es la solución del ejercicio 1.3 del libro Machine Learning de Tom M. Mitchell?

¿Cómo se diseñan y desarrollan las nuevas arquitecturas de aprendizaje profundo?

¿MATLAB es el software más conveniente para el aprendizaje automático?

¿Dónde puedo encontrar corpus de texto médico en inglés para entrenar mis datos?

Si pudieras elegir cinco miembros perfectos para un equipo de desarrollo de aprendizaje automático y en la nube, ¿qué habilidades requerirías que tuvieran?

¿Aprender implementando un buen enfoque, o leyendo y usando marcos como TensorFlow?

¿Qué requisitos previos debe tener para aprender la teoría de las redes neuronales artificiales?

¿Cómo implemento un análisis de sentimiento a nivel de documento?

¿Puedo usar la agrupación (k-means, etc.) en un gran conjunto de datos para automatizar el proceso de búsqueda de similitudes y hacer recomendaciones?

Web Analytics