Al entrenar un modelo de Deep Learning, ¿importa la secuencia o el orden de las muestras en los datos de entrenamiento?

Hablando estrictamente, el impacto que las variaciones en la secuencia de datos de entrenamiento pueden tener en un modelo de red neuronal depende completamente del paradigma de aprendizaje que haya implementado. Debido a que no sé qué tan familiarizado está con el campo y también debido a la posibilidad de que los legos encuentren esta respuesta, intentaré explicar esto en un lenguaje no técnico:

Neuroplasticidad en el aprendizaje

Ya sea que lo sepan o no, la mayoría de las personas están familiarizadas con el concepto de neuroplasticidad: las redes neuronales cambian y se adaptan en respuesta a pares de entradas y resultados del mundo real. Además, está bien documentado que la plasticidad es grande o pequeña dependiendo de la familiaridad de un sujeto con estos emparejamientos estímulo-resultado. Para ser específicos, si has visto una moneda voltearse suficientes veces, gradualmente construyes un modelo mental de la probabilidad de que la moneda caiga en cara o cruz. A medida que aumenta el número de vueltas que observa, aumenta su certeza de la probabilidad y hay un cierto retorno decreciente de cada observación adicional. Si nunca ha visto una moneda o no ha pensado en la probabilidad del resultado de lanzarla, podría beneficiarse más al observar algunos lanzamientos en relación con alguien que ya había ajustado su modelo mental de este juego de probabilidades.

Entrenamiento temprano vs. tardío

Para construir sobre la idea de cambios en la neuroplasticidad con la familiaridad de la tarea, proporciono un ejemplo adicional de rehabilitación auditiva temprana versus tardía con implantes cocleares. Las habilidades del lenguaje, incluida la entonación, la pronunciación y la comprensión, son mejores para quienes recibieron implantes dentro de ventanas críticas del neurodesarrollo que para quienes no lo recibieron [1]. Estas ventanas de desarrollo críticas, relacionadas con la plasticidad cerebral, se definen como “el tiempo durante el desarrollo cuando una manipulación o experiencia específica cambia la trayectoria de desarrollo de un sistema” [2]

Trayectorias del desarrollo

Los mecanismos sinápticos y neuronales a microescala que emergen como plasticidad cognitiva son mucho más complejos que las reglas de aprendizaje utilizadas actualmente para el aprendizaje automático; Predigo que esto cambiará con el tiempo a medida que los modeladores se den cuenta de las ventajas que tiene este realismo biológico sobre el estado actual de la técnica. Recordando el ejemplo de la trayectoria de aprendizaje que señalé anteriormente, puede ver cómo un cambio en la trayectoria temprana o tardía en la capacitación de un modelo podría tener resultados dramáticamente diferentes. Para vincular esto con nuestro ejemplo inicial de lanzamiento de monedas, un apostador experimentado no abandonaría su modelo mental de probabilidades de 1 en 2 para caras, incluso si veía una moneda caer sobre las cabezas diez veces seguidas, mientras que un novato podría ser más fácilmente convencido (para su gran detrimento) que una moneda que cae sobre su cabeza diez veces seguidas aprovecha su propia física especial para hacerlo.

Volver al aprendizaje profundo

Al entrenar un modelo, si tiene una regla de aprendizaje que cambia con el tiempo (es decir, más o menos flexible con las iteraciones), entonces el modelo se ve influenciado positivamente por el orden de emparejamiento estímulo-resultado al que se introduce [3]. Si tiene un sistema de este tipo, experimente con esto agrupando sus entradas por función de una manera ordenada y luego compare su modelo ajustado con uno en el que estas entradas sean aleatorias.

¡Espero que esto haya sido útil!

Notas al pie

[1] http: // Tomblin, JB, Barker, B …

[2] http: // Bruer, J. (2001). Una crítica …

[3] http: // Weber, C., Elshaw, M., Nosotros …

No, el orden secuencial no es importante. Pero es importante que considere todos los conjuntos de datos posibles. No puede entrenar algunos conjuntos de datos primero y luego otros conjuntos de datos. Porque por ese proceso la máquina olvida los conjuntos de datos anteriores.

La secuencia no es importante ya que los pesos asignados a los valores están moderados, o dicen un peso medio. Entonces, cuando aplique el modelo, las predicciones serán de acuerdo con las entradas.

PD : elija cuidadosamente los conjuntos de datos de entrenamiento y prueba. Los conjuntos de datos de prueba le ayudarán a obtener un estimador o un error aproximado que ayudará en una predicción adecuada

Cuantos más datos le proporcione, más aprenderá. Si le da entradas repetitivas, será más fácil clasificar entradas similares en el futuro.

More Interesting

¿Cuál es la diferencia entre el procesamiento de señales estadísticas y el aprendizaje automático?

Si una máquina aprende algo del aprendizaje automático, ¿está creando un nuevo código que puede transferirse a otras máquinas?

¿Cuál es el mejor lenguaje para usar mientras aprende el aprendizaje automático por primera vez? Voy a tomar un curso sobre aprendizaje automático este trimestre y tengo la opción de elegir entre usar C, C ++, Java, Haskell, Lisp, Python o Matlab / Octave.

¿Cómo cambiará la IA los virus / malware informáticos?

¿Cómo funciona Deep Blue?

¿En qué debería centrarme: cosas de bajo nivel, inteligencia artificial, algoritmos generales (más desde la perspectiva matemática) o matemática pura en sí misma?

¿Cuál es el próximo tema candente en el aprendizaje automático?

¿Debería la prueba de Turing guiarnos mientras diseñamos robots súper inteligentes?

¿Cómo se pueden visualizar las características extraídas en capas ocultas de una red neuronal?

¿De qué sirve el aprendizaje automático en las telecomunicaciones?

Dado el estado actual de AI / ML, ¿cómo afectó las elecciones presidenciales de 2016?

Inteligencia artificial: ¿Puede una persona inteligente sola crear una IA más inteligente que la humana?

¿Hay algún ejemplo de robots que maten humanos sin razón lógica?

¿Hay alguna manera de decidir si una simulación perfecta de todos los aspectos de su estado mental es realmente consciente?

¿Es la IA la próxima ola de evolución? ¿Es esto lo que es 'Kali Yuga'?