¿Cuáles son las deficiencias del aprendizaje profundo? ¿Cuál es el mayor defecto o limitación del aprendizaje profundo?

Además de los buenos puntos que se plantean aquí, me gustaría agregar una razón por la que no reemplazará los modelos estadísticos estándar.

Un modelo de aprendizaje profundo no le dice qué causó o contribuyó realmente a su objetivo. Muchas veces, al construir modelos, necesitan tener un buen poder predictivo, pero también deben ser accionables. Entonces, ¿qué pasa si su modelo de aprendizaje profundo puede predecir un próximo viaje en la máquina o una pérdida de clientes con una precisión del 89%? Si el modelo no le dice qué factores contribuyeron a un mayor riesgo, la predicción en sí misma vale menos, ya que no son procesables.

En general, las aplicaciones adecuadas para el aprendizaje profundo son aquellas en las que solo el resultado en sí es importante, y no la comprensión de los factores que intervienen en el resultado. Afortunadamente, las aplicaciones donde el rendimiento es lo único que importa son muchas, razón por la cual el aprendizaje profundo y otras técnicas de ML de ‘caja negra’ son tan exitosas.

El mayor defecto es el descubrimiento de que al ajustar una imagen de entrada de una manera específica, uno puede engañar a una Red neuronal de aprendizaje profundo para que se clasifique erróneamente. Este es un problema no solo para el aprendizaje profundo sino para casi todos los métodos de aprendizaje automático que emplean álgebra lineal para aproximar sus clasificaciones.

Secundario a este defecto es el requisito de un gran tamaño de entrenamiento etiquetado para aprender nuevos conceptos.

Tercero, la falta de interpretabilidad de los modelos que se aprenden.

La cuarta es la limitación de que cualquier algoritmo de clasificación de aprendizaje automático que aprenda de los datos solo se limita a identificar la causa dados los efectos observados. Estos sistemas tienen límites en su capacidad para predecir el comportamiento de otros sistemas complejos. Es decir, predecir el efecto dada una causa.

Quinto es la incapacidad de realizar un aprendizaje no supervisado con la excepción de los codificadores automáticos.

He creado un lenguaje de patrones para el aprendizaje profundo que puede explorar más a fondo para obtener una mejor comprensión del campo.

¡La mayor limitación en mi experiencia es entender por qué un algoritmo particular funciona realmente tan bien! Sé que recientemente se ha realizado un trabajo para visualizar las características de la capa superior y observar los filtros de peso en una red neuronal convolucional. Sin embargo, tratar de visualizar los aspectos internos de algunos enfoques, como las máquinas de boltzmann restringidas y las redes de creencias profundas, aún no está tan claro.

Esto hace que sea un desafío responder preguntas como por qué un enfoque particular de aprendizaje profundo no pudo clasificar una imagen / entrada particular.

El mayor defecto del aprendizaje profundo es que requiere conjuntos de entrenamiento masivos. El aprendizaje profundo es maravilloso porque analiza un gran número de características y (si está capacitado adecuadamente) puede superar los problemas de sobreajuste al comprender las excepciones. Los conjuntos de entrenamiento grandes deben ser lo suficientemente grandes como para superar el problema “p> n”, donde el número de variables o parámetros p es mucho mayor que el número de observaciones n. Los métodos de aprendizaje profundo (como todos los enfoques de aprendizaje automático) deben usar el modelo del “tamaño correcto” (cuántas características se evalúan) que sea apropiado para el tamaño de los datos. Aquí hay una buena descripción general: Una breve descripción general del aprendizaje profundo

More Interesting

¿Qué es la validación cruzada?

¿Cuándo es PyTorch más útil en comparación con TensorFlow y viceversa?

¿Cuáles son las diferencias entre los modelos pre-entrenados y entrenados?

Como estudiante universitario de ciencias de la computación, cuál es la mejor opción entre cs o estadísticas Ph.D. para la carrera de ciencia de datos?

¿Cuáles son las soluciones de producción efectivas para el reconocimiento de entidades nombradas?

En la calificación crediticia, ¿cuáles son las ventajas y desventajas del aprendizaje automático en relación con las técnicas de regresión tradicionales?

Soy un ingeniero electrónico que conoce algoritmos de aprendizaje automático, big data, estadísticas, SQL, Matlab. ¿Puedo ser contratado como ingeniero de IA de nivel básico?

Dado que existen marcos optimizados en línea, ¿vale la pena implementar manualmente implementaciones vectorizadas para redes neuronales complicadas?

¿Cuál es más importante de los tres, es decir, informática ubicua, informática distribuida y procesamiento de lenguaje natural, en el mundo de hoy?

Tengo un conjunto de puntos 3D y cada uno tiene una puntuación. ¿Cómo encuentro / busco un grupo denso de puntos de alta puntuación?

¿Qué es el generador Deep Dream?

¿Cuál es mejor, el modelo de regresión o ecuación estructural, y por qué?

Veo que la mayoría de las API de Machine Learning están en Python, algunas usan C o C ++ bajo el capó. ¿Por qué los desarrolladores de framework no exponen las API de C ++?

¿Cuáles son los pros y los contras de aprender ExpressJS?

¿Por qué hay tantas preguntas sobre Machine Learning en Quora?