¿De qué manera es una ‘Máquina de Turing Neural Lie Access’ superior a las NTM normales?

Informalmente, los grupos de Lie son grupos continuos de simetrías. Por ejemplo, el grupo de rotaciones del círculo unitario es un grupo de Lie, ya que podemos rotar el círculo en cualquier grado y permanece invariable.

Un grupo es un conjunto combinado con una operación tal que cualquier elemento del grupo operado con cualquier otro elemento todavía está en el grupo, existe un elemento de identidad y para cada elemento existe un inverso. (También la operación es asociativa).

En una máquina de Turing, hay una cinta, un cabezal y un controlador. La cabeza mira un punto discreto de la cinta a la vez y el controlador “decide” si leer o escribir en esa posición en la cinta, y si mover la cabeza hacia la derecha o hacia la izquierda.

Esto admite la indexación relativa, ya que el movimiento a lo largo de la cinta corresponde a la acción grupal de suma en los enteros. Sin embargo, en una máquina de Turing neural , en lugar de generar acciones, el controlador genera distribuciones sobre posibles acciones para hacer que el sistema sea diferenciable. Esto significa que la estructura del grupo desaparece, por lo que no se admite la indexación relativa.

Las máquinas de Turing neural de acceso a mentiras generalizan la acción grupal continua de moverse alrededor de la cinta en una máquina de Turing a una acción grupal continua a través de grupos de mentiras. Volviendo al ejemplo del círculo, ahora, en lugar de que el controlador especifique cuántos pasos discretos hacia adelante o hacia atrás, puede dar un grado para dar la vuelta al círculo.

¡Lo bueno de esto es que ya no necesitamos generar distribuciones de probabilidad ya que los grupos de Lie ya son diferenciables! Así que este es realmente un documento impresionante, y abre muchas oportunidades para usar redes neuronales para la indexación relativa.

More Interesting

¿Qué es la entropía cruzada en palabras fáciles?

¿Cómo escriben las personas pruebas automatizadas para sus algoritmos estocásticos?

¿Qué núcleo (para los métodos de núcleo en el aprendizaje automático) es menos sensible a la alta dimensión: cauchy, gaussiana o laplaciana?

¿Puede un contador estar completamente automatizado para 2030? Si es así, ¿cuál es la mejor manera de salvar mi trabajo?

Cómo diferenciar entre características globales y características locales en una imagen

En el aprendizaje profundo, ¿son el "aprendizaje incremental" y el "aprendizaje de transferencia" el mismo enfoque?

¿Es posible usar datos sintéticos (no de la vida real) en un modelo de aprendizaje automático?

¿Cómo funciona Google Deep Dream?

Sistemas móviles: ¿Qué empresas / organizaciones de investigación están trabajando en el área de análisis de comportamiento / sistemas colaborativos basados ​​en dispositivos móviles?

¿Puede el preprocesamiento de datos en redes neuronales de IA (aprendizaje profundo) ser dinámico y automatizado (en lugar de estático y manual)?

¿Alguien siente que la programación de sistemas tradicionales es muy diferente del aprendizaje automático?

¿Cómo es la aplicación K-Means de maximización de expectativas en Naive Bayes?

¿Qué es mejor que el aprendizaje profundo?

¿El antiguo guardia de IA ha frenado la investigación de aprendizaje automático en el MIT?

Además de experimentar emoción, ¿qué cosas puede hacer un niño humano que una computadora no puede hacer?