¿En qué se diferencia la teoría del “cuello de botella de información” del aprendizaje profundo del ejemplo conocido de tener una capa oculta de dimensión reducida en un codificador automático?

El cuello de botella reducido es una descripción de cómo se reduce la información real que pasa a cada capa adicional, no una reducción en el número de unidades. Aunque ciertos aspectos específicos de los datos anteriores de cada capa se consideran innecesarios para la clasificación entrenada, es bueno tener más disponibles para elegir. Con más unidades, deberías poder hacer mejores modelos, más rápido. Una vez que comience a eliminar unidades (reduciendo la dimensión), la cantidad de elementos disponibles para construir el modelo en la siguiente capa disminuye, haciendo que esa capa en particular sea menos flexible y, en el caso de un autoencoder reducido, reduciendo esa diferencia a un nivel inferior capa donde hay más unidades para ajustar y hacer el trabajo de ajuste.

Puede ser posible entender esto a través del arte infantil. Si tiene muchos crayones de diferentes colores disponibles en su caja de crayones, puede reproducir con precisión su sujeto multicolor más rápido. Si tiene menos crayones (dimensión reducida), probablemente aún pueda hacer lo mismo, pero tendrá que mezclar algunos colores o construir algunos colores diferentes y hacerlos disponibles en su conjunto primario (reducido). El método real de creación de sus crayones sería el mismo en ambos casos, y el cuello de botella de información se relaciona con eso. Verde + Amarillo se convierte en el nuevo amarillo-verde (reducción del tipo de cuello de botella de información), donde el verde o el amarillo ya no son necesarios.

Aprendizaje automáticoAprendizaje profundoRedes neuronales artificialesTeoría de la información

Related Content

¿Qué es mejor para alguien que esté dispuesto a hacer un doctorado en visión artificial: conocer un método en profundidad y aplicaciones ampliamente, o lo contrario?

¿Por qué hay tantas preguntas sobre Machine Learning en Quora?

¿Cuáles son los principales niveles de clasificación de reclusos?

¿Cuáles son los problemas con el enfoque de clasificación uno contra todos?

¿Qué es una comprensión intuitiva del análisis factorial?

¿Qué alternativas a las redes convolucionales para las tareas de aprendizaje automático de imágenes se están investigando ahora?

¿Cuál sería un buen enfoque de aprendizaje automático para un bot de comercio de criptomonedas con aproximadamente media docena de parámetros de entrada de estrategia de comercio numérico y una salida numérica (porcentaje de ganancia diaria)? Todos los días el modelo probaría nuevos parámetros.

More Interesting

¿Cuál es la diferencia entre machine learning y IOT?

¿Cuáles son los algoritmos de agrupamiento más populares?

¿Hay algo que Deep Learning nunca podrá aprender?

¿Cómo puede Google diseñar un procesador más adecuado para el entrenamiento de redes neuronales profundas que la GPU?

¿Ha habido algún éxito con el aprendizaje profundo bayesiano?

¿Cuál es la importancia del análisis de componentes principales (PCA) en el modelado predictivo?

Dada una red de aprendizaje profundo, ¿se puede entrenar para enseñar (por ejemplo, resolviendo la secuencia óptima de ejemplos o lo que sea) otra red? Si es así, ¿se puede resolver este problema (enseñanza) utilizando técnicas de aprendizaje profundo?

¿Cuáles son algunos de los problemas de aprendizaje automático (nivel introductorio) que un estudiante de economía puede modelar con los datos disponibles para una tesis de licenciatura?

¿Cuál es una buena definición de Generalización wrt Deep Learning?

¿Cómo se usa el aprendizaje automático en la inversión?

¿Cuándo se lanzará sklearn 0.18?

¿Qué requisitos previos debe tener para aprender la teoría de las redes neuronales artificiales?

¿Cómo sugeriría Carlos Matias La Borde que un novato aprenda el aprendizaje automático?

¿Cómo escapa / resiste una red neuronal profunda a la maldición de la dimensionalidad?

¿Qué consejo le darías a un principiante para aprender el aprendizaje automático solo?

Web Analytics