¿Sencillo? Seguro.
Si ya sabe qué es una red neuronal tradicional:
Un RNN simplemente usa fuentes de entrada anteriores dentro de los cálculos. Digamos que está analizando la escritura a mano, puede predecir palabras y letras futuras mucho mejor si recuerda las letras anteriores. Si está muy seguro de que la persona escribió “ganar”, puede usar eso para ayudar a descifrar las futuras w, i y n, ya que probablemente se parecerán mucho a los caracteres utilizados en esa palabra.
- ¿Cuáles son los algoritmos clásicos de aprendizaje automático similares a los modelos de secuencia a secuencia?
- ¿Puede la inteligencia artificial crear otra inteligencia artificial más inteligente que todas las inteligencias artificiales?
- ¿Aprender el modelo de Tensor Flow con Python es realmente útil para mí en el futuro?
- Cómo encontrar un mercado para robots
- ¿Qué son las no linealidades continuas en el contexto de las funciones de activación en redes neuronales?
Si no sabe qué es una red neuronal, agregue lo anterior a la explicación a continuación:
Tienes un montón de puntos en ese clásico diagrama de red neuronal que has visto:
Parece complejo BS? Estoy de acuerdo…
Como ejemplo, nuestra red tomará una muestra de voz como entrada y dará salida a la ubicación de acento.
Los puntos (“nodos”) están conectados a otros puntos y representan información. Puede tratarse de cualquier tipo de información recopilada, como “el espacio entre palabras en la muestra de voz coincide significativamente con el acento de Manhattan” o “la cadencia suena hispana”. Estas salidas, si se alcanzan, son las entradas para la siguiente capa.
Para que una conexión de punto (la flecha de uno a otro) se “dispare”, se debe cumplir el umbral de una función de activación. Digamos que para un acento británico, el rango de tono generalmente varía en una octava completa: la función de activación calcula el rango de tono, y si está por encima de un umbral, dispara la ruta al nodo “el rango de tono suena británico”. Si no, no vayas!
Las conexiones pueden tener pesos, lo que significa la importancia de esa conexión: si los acentos británicos son uno de los pocos acentos que tienen una octava completa, y la muestra tiene ese rango, ¡hay una alta probabilidad de que el acento ingresado sea británico! Dale a esa conexión un alto peso.
Digamos que la siguiente capa verifica la redondez de las sílabas. Usando los resultados de la primera capa como entradas, crea funciones / pesos para la siguiente capa. Y el siguiente … hasta que toda la información que desee esté suficientemente explicada.
Al final, llega al punto de salida, donde su programa toma la decisión. Esta última parte analiza los resultados para determinar el acento más probable.
Con buenos pesos, funciones de activación sólidas y muchos datos de entrenamiento (que pueden usarse para ayudar a establecer sus pesos), el programa puede determinar con precisión los resultados.