¿Qué piensa la gente del siguiente documento que señala los límites del aprendizaje de extremo a extremo?

Lo leí y no aprendí nada nuevo.

Las limitaciones señaladas ya son bien conocidas. Los experimentos son una broma: sí, los DNN son datos ineficientes, lo cual es algo malo, ¡pero esa no es una idea nueva! Y sí, dado que realmente no entendemos por qué los DNN logran alcanzar óptimos locales utilizables cuando lo hacen (por ejemplo, para tareas de reconocimiento de imágenes), es completamente posible que nos topemos con las tareas en las que el panorama de optimización se ve bastante diferente, ¡y ya no podremos alcanzar buenas óptimas locales!

Ya hubo discusiones interesantes sobre los intentos de Nvidia de aprender un sistema de conducción autónoma de extremo a extremo, con Amnon Shashua señalando las debilidades. Aprendí mucho más de esas discusiones.

Aquí hay una página de Quora con enlaces a los comentarios de Shashua sobre el trabajo de Nvidia:

El CTO de Mobileye dice que las redes neuronales profundas de extremo a extremo, como NVIDIA, no funcionarán para automóviles autónomos. ¿Tiene razón?

Parece señalar los límites de un solo módulo o enfoque de extremo a extremo. Estoy de acuerdo con el documento y creo que se requiere un enfoque de arquitectura. Puedo imaginar una arquitectura con diferentes tipos de modelos que juntos comiencen a proporcionar algo como aprendizaje de extremo a extremo.

More Interesting

Cómo convertir datos categóricos en numéricos por Excel

¿Se utiliza el aprendizaje automático para resolver otros problemas en lugar de problemas relacionados con la inteligencia artificial?

¿Es C ++ un buen lenguaje para el aprendizaje automático?

Cómo decidir el tema de mi interés de investigación para obtener un doctorado en visión artificial y aprendizaje automático

¿Cuáles son las funciones básicas del olfato? Al igual que los datos visuales se pueden aproximar en una base 3D (RGB, HSI, etc.), ¿se puede aproximar el olor como una suma lineal de unos pocos olores básicos?

¿Qué método de aprendizaje profundo es el más adecuado para PNL?

¿Cómo superan los modelos de lenguaje neuronal (NLM) la maldición del problema de dimensionalidad para modelar el lenguaje natural?

¿Cómo se encuentran los trabajos de consultoría en machine learning + PNL?

Cómo implementar el muestreo ponderado de yacimientos

¿Hay orden entre las características de las incrustaciones de palabras?

¿Las redes neuronales son solo clasificadores lineales vinculados con no linealidades?

¿Cuál es la mejor clase de Machine Learning en Penn?

¿Cómo lidian las personas con visión artificial con el sobreajuste?

¿De qué sirven los algoritmos de aprendizaje si no podemos pensar por nuestra cuenta?

¿Debemos usar el ajuste fino en redes neuronales profundas? La precisión de la clasificación es del 100%, pero después de un ajuste fino, se convierte en el 95.7%, ¿cómo llega esto?