¿Cómo se puede diseñar la topología de una red neuronal artificial con una capa oculta para lograr efectivamente la reducción de la dimensionalidad?

Parece que estás hablando de un autoencoder. Básicamente, estos logran una reducción de dimensionalidad no lineal al entrenar a la red para reconstruir sus propias entradas en la capa de salida. La idea básica es tener una capa oculta con una cantidad de unidades ‘n’ menor que la cantidad de características de entrada ‘N’, seguida de una capa de salida con unidades ‘N’. La red se entrena utilizando, por ejemplo, el error cuadrático medio hasta que la pérdida, que es el error de reconstrucción promedio, deja de mejorar. Para acceder a la representación reducida de los datos, simplemente corte la capa de salida de la red para acceder a la capa oculta.

Hay otras variaciones en esto, por ejemplo, autoencoder denoising que elimina la restricción de que el tamaño de la capa oculta es menor que el número de entradas, pero lo anterior es la idea básica. Si desea más información, eche un vistazo a “creación de codificadores automáticos en keras” y “una perspectiva múltiple sobre codificadores automáticos”.

More Interesting

¿Cuándo puede el aprendizaje profundo ser una herramienta inadecuada para una empresa?

¿Qué tan lejos estamos de usar el reconocimiento de voz como interfaz de usuario en un teléfono para cerca del 100% de todas las funciones (sin entradas de teclado o deslizamiento)?

¿Qué medida de evaluación fuera de línea para los sistemas de recomendación se correlaciona mejor con los resultados de la prueba AB en línea?

¿Tener un conocimiento profundo del aprendizaje por refuerzo cambia su perspectiva hacia la vida? ¿Cómo?

¿Para qué se utiliza el aprendizaje automático?

Cómo implementar el aprendizaje automático en una aplicación de Android

¿Cuál es la mejor manera de manejar los valores atípicos en Machine Learning?

¿Cómo reconocemos a un usuario en particular en un registro de chat de Internet multiusuario largo?

¿Cómo se compara Scikit Learn con R (en términos de velocidad, conveniencia y potencia)?

¿Cuáles son las mejores fuentes para aprender el aprendizaje automático y el procesamiento del lenguaje natural?

En una máquina de vectores de soporte, el número de vectores de soporte puede ser mucho menor que el conjunto de entrenamiento. ¿Cómo puede ser útil esta característica?

¿Hay un LSTM en TensorFlow que procesa un carácter a la vez?

¿Puede un fármaco ser estadísticamente efectivo para toda la población, pero estadísticamente no es efectivo para todas las subpoblaciones (como hombres y mujeres) por separado?

¿Por qué hay tantas redes de aprendizaje profundo?

¿Qué consejo le darías a alguien que acaba de comenzar el curso de Andrew Ng sobre aprendizaje automático?