¿Cuál es el mejor artículo para entender cómo se mapea el vector de salida de RNN con un vocabulario para predecir la secuencia?
Dichos conceptos son inherentes a cada artículo relacionado con la secuencia. Por lo tanto, puede elegir cualquiera de esos documentos teniendo en cuenta lo siguiente.
- El RNN genera un vector que * ha exigido * que tenga la misma dimensión que un vocabulario finito. Por lo tanto, los elementos en el vector de salida RNN tienen una correspondencia uno a uno con los elementos del vocabulario.
- Ahora, para predecir cada elemento de la secuencia, su objetivo, como sabe, es elegir un miembro del vocabulario finito para cada elemento de la secuencia. ¿Cómo sabes qué miembro es mejor para ese elemento? Bien. Debido a que las salidas RNN generalmente se normalizan para ser una distribución de probabilidad de la misma dimensión, ahora tiene sentido elegir el miembro que es * más grande * que cualquier otro miembro en el vocabulario para ese elemento en la secuencia.
- O, dado que la probabilidad de la secuencia predicha completa no es el producto de las probabilidades de cada elemento (debido a la RNN entre la entrada y la salida), elegir el miembro más probable para cada elemento puede no ser el mejor. Aquí es donde entran la búsqueda de haces y todas las demás técnicas de decodificación.
- ¿Qué compañías con sede en Dallas están desarrollando y / o invirtiendo en tecnologías de Inteligencia Artificial / Aprendizaje Automático?
- ¿Cómo puedo comenzar el análisis de datos en un gran conjunto de datos?
- ¿Las empresas de reconocimiento de imágenes / servicios API utilizan solo modelos neuronales profundos y nada más?
- ¿Se ha resuelto el problema de reconocimiento de caracteres escritos a mano?
- ¿Cuáles son algunos libros sobrevalorados en aprendizaje automático, estadísticas y aprendizaje profundo?