¿Por qué las variedades son importantes para el aprendizaje profundo o el aprendizaje de refuerzo profundo?

Explicaré el qué / cómo y luego explicaré el por qué / los beneficios a continuación.

¿El qué / cómo?

El aprendizaje múltiple, anotado como [matemáticas] \ phi \ big (x, \ theta \ big) ^ {\ top} w [/ matemáticas] (Bengio et al), permite que se aprendan “factores de variación”.

Los colectores están en el régimen de algoritmos muy generales, que permiten a los modelos aprender muchos grados de libertad en el espacio latente (es decir, posición, escala, etc., donde dichos grados son observables como características de interacciones físicas ) donde las transformaciones en puntos pueden representar, por ejemplo, las características de un objeto particular en el espacio de píxeles, y las transformaciones en dichos puntos o pesos de un objeto son desenredables o separables de las pertenecientes a otros objetos en el espacio latente. (Aprendiz de concepto visual temprano, redes de expresividad de teoría de campo media, etc.)

(Vea la fuente del fragmento aquí)

El por qué / beneficios: ¿comparación con trabajos anteriores?

Por ejemplo, debido a que el aprendizaje múltiple puede desenredar las características de un objeto de otro en un “espacio latente”, podemos entrenar tales modelos múltiples para aprender de maneras que obtengan beneficios de trabajos previamente algo separados.

Tenga en cuenta que es importante construir nuestros algoritmos de aprendizaje teniendo en cuenta las restricciones biológicas , especialmente en los objetivos de hacer más y más algoritmos generales y, finalmente, la inteligencia general artificial.

Con lo anterior en mente, vemos que los cerebros biológicos aprenden “leyes de la física”, y también aprenden mediante el aprendizaje por refuerzo.

Sin embargo, se utilizan tipos separados de modelos para lograr las cosas anteriores ; métodos de agrupación como “uetorch” para aprender los ” antecedentes físicos ” mencionados anteriormente, y métodos de no agrupación como “atari q player” para aprender por refuerzo.

Entonces, obtienes lo ” mejor de ambos mundos” , es decir, para beneficiarse tanto de las cosas importantes que se agrupan, como de las cosas importantes que no se agrupan, podemos usar múltiples redes, donde las transformaciones en nuestras representaciones aprendidas pueden variar con algunas características, siendo invariable para los demás!

Deepmind ha demostrado recientemente que mejora algo importante llamado aprendizaje de transferencia , al usar estas múltiples redes para aprender factores de variación, junto con las características aprendidas de la física de los objetos en el espacio latente:

Aprendizaje visual temprano del concepto con aprendizaje profundo no supervisado

El aprendizaje por transferencia se ve notablemente en la inteligencia biológica general.

More Interesting

¿Cuáles podrían ser las características posibles para detectar fraude en transacciones en cajeros automáticos?

¿Debo abandonar mi programa de doctorado CS para estudiar por mi cuenta?

¿Cómo manejo la recompensa retrasada en el aprendizaje por refuerzo?

¿Cómo toman decisiones las neuronas del cerebro? ¿Funcionan de la misma manera que las neuronas artificiales en ANN?

¿Cuánto tiempo hasta que tengamos aviones autónomos, particularmente aviones de carga grandes y aviones de pasajeros?

¿Por qué la traducción automática neuronal a nivel de caracteres es más difícil que la traducción automática neuronal a nivel de palabra?

¿Cuál es la diferencia entre TensorFlow y Grep? ¿Cuál es el más adecuado para el aprendizaje automático? ¿Por qué o por qué no?

¿Es la verificación en el aprendizaje profundo un tema candente?

¿Qué tan lejos estamos de usar el reconocimiento de voz como interfaz de usuario en un teléfono para cerca del 100% de todas las funciones (sin entradas de teclado o deslizamiento)?

¿Dónde puede encontrar ejemplos de codificación de TensorFlow no obsoletos?

¿Por qué los clasificadores Naive Bayes se consideran relativamente inmunes al sobreajuste?

¿La asignación de Dirichlet latente es un modelo paramétrico o no paramétrico?

¿Cuál es la diferencia entre el aprendizaje por refuerzo y la optimización?

Tengo un conjunto de datos con una combinación de datos cualitativos y cuantitativos, ¿cómo puedo inferir una relación o sensibilidad entre las columnas?

Si pudieras elegir cinco miembros perfectos para un equipo de desarrollo de aprendizaje automático y en la nube, ¿qué habilidades requerirías que tuvieran?