¿Son las redes neuronales generalmente reversibles?

Lo que estás diciendo parece similar a las redes de escalera. En realidad es muy prometedor.

De este sitio:

Introducción al aprendizaje semi-supervisado con redes de escalera

¿Cómo beneficiará la inteligencia artificial al mundo de los profesionales de TI en Sudáfrica en el futuro?
¿Se puede usar la computación humana gratuita para inventar servicios inteligentes de computación humana (por ejemplo, Duolingo)?
¿Qué rama del aprendizaje profundo sería más apropiada para estudiar la visión por computadora o el procesamiento del lenguaje natural considerando las oportunidades de trabajo?
¿Podemos usar el algoritmo de aprendizaje de refuerzo Q-learning para hacer frente a los nuevos estados del entorno creados?
Los robots persiguen nuestros trabajos. ¿Qué podemos hacer?

Los pasos involucrados en la implementación de la red Ladder son típicamente los siguientes:

Tome un modelo feedforward que sirva de aprendizaje supervisado como codificador. La red consta de 2 rutas de codificador: codificador limpio y dañado. La única diferencia es que el codificador dañado agrega ruido gaussiano en todas las capas.
Agregue un decodificador que pueda invertir las asignaciones en cada capa del codificador y admita el aprendizaje sin supervisión. El decodificador utiliza una función de eliminación de ruido para reconstruir las activaciones de cada capa dada la versión dañada. El objetivo en cada capa es la versión limpia de la activación y la diferencia entre la reconstrucción y la versión limpia sirve como el costo de eliminación de ruido de esa capa.
El costo supervisado se calcula a partir de la salida del codificador dañado y el objetivo de salida. El costo no supervisado es la suma del costo de eliminación de ruido de todas las capas escaladas por un hiperparámetro que denota la importancia de cada capa. El costo final es la suma del costo supervisado y no supervisado.
Capacite a toda la red en un entorno totalmente etiquetado o semi-supervisado utilizando técnicas de optimización estándar (como el descenso de gradiente estocástico) para minimizar el costo.

Otra posibilidad es usar las salidas B para generar entradas A como las redes neuronales recurrentes.

En cuanto a su pregunta sobre qué dirección es mejor, diría que depende de lo que esté tratando de hacer. Para la clasificación, debe aprender el mapeo de la entrada A a la salida B, pero para las tareas generativas necesita generar entradas A del tipo definido por la salida B.

¿Qué lenguaje de programación usan los programadores de juegos de IA?

¿Cuáles son algunas diferencias artificiales entre Finlandia y Suecia?

¿Qué es una tubería en el aprendizaje automático?

¿Cuándo combino algoritmos genéticos con redes neuronales?

¿Cómo se relacionan los modelos gráficos probabilísticos (PGM) con el aprendizaje automático?

¿Hay algún instituto en la India que ofrezca estudios en inteligencia artificial y aprendizaje automático?

Si crea dos modelos diferentes y A y B pueden usarse como niveles para la clasificación o para la regresión, entonces quizás, pero no necesariamente puede ir hacia atrás.

Lo más parecido a lo que está hablando en las redes neuronales sería la propagación que se encuentra aquí.

Melvin Dunn

De alguna manera, esto es equivalente a retroceder en Prolog.
Pero la naturaleza del problema se ilustra al considerar que a cualquier reconocedor se le puede asignar cualquier asignación de patrón de salida. Por ejemplo, un número romano V podría asignarse al símbolo de salida ‘5’, pero una fuente Arial ‘5’ también podría asignarse a un número 5. Ahora imagine que intenta retroceder. Incluso si comienza con un número 5 y retrocede, puede terminar con muchos patrones de activación que hicieron que ese 5 disparara. Ahora imagine lo mal que se pone esto si comienza con el punto final ‘perro’ y quiere saber qué provocó ‘perro’. Si el mecanismo diseñado no hace que las características de la capa oculta sean muy comprensibles, tendría un problema para separar la causalidad probable.
Supongo que los cerebros humanos retroceden arrojando datos aleatorios en las entradas hasta que obtienen un parpadeo de reconocimiento, luego refinan el ‘ruido’ de tal manera que comience a aumentar la cantidad de respuesta de reconocimiento. Estoy tratando de recordar un auto, entonces lanzo ‘auto’ luego ‘muscle car’ luego ‘Dukes of Hazard’, etc.

Sohaib Arif

More Interesting

¿Cómo diferencia una computadora entre un automóvil estacionado y un automóvil parado?

¿Qué tan buena es la IA a partir de 2016?

Cómo diseñar la personalidad de un chatbot

¿Los tamaños de kernel de capa maxpooling en CNN son generalmente más pequeños que los tamaños de kernel de capa convolucional? ¿Por qué?

Como aprender machine learning en casa

¿Por qué la automatización está presionando tanto y provocando tanto retorcimiento de manos?

¿Por qué los ingenieros y científicos famosos dicen que la IA es peligrosa?

Si eres bilionario, ¿puedes comprar un software de síntesis de voz con una voz humana que parezca tan real que nadie pueda decir que es una computadora?

¿Existe un mejor tutorial para el aprendizaje profundo que deeplearning.net?

¿Debo dejar de preocuparme por el futuro de la IA y la robótica, la adquisición y el reemplazo de trabajos?