¿Existe alguna implementación del modelo de atención en el flujo tensorial?

Sí, el mecanismo de atención introducido en https://arxiv.org/pdf/1412.7449.pdf se implementa en tf.contrib.legacy_seq2seq.attention_decoder ().

Puede usar el attention_decoder separado o como parte de un modelo tf.contrib.legacy_seq2seq .

¿Cómo agrega Quora el aprendizaje automático a su aplicación web?
¿Cómo se puede hacer la experimentación de aprendizaje profundo en una PC en casa?
¿Cómo deben normalizarse los datos de entrada al entrenar un SVM con un algoritmo en línea?
¿Cómo afectan los registros duplicados en el conjunto de datos de entrenamiento a un clasificador Naive Bayes?
¿Se pueden programar las computadoras para comprender el valor estético de algo?

Asegúrese de echar un vistazo al código, porque su implementación es muy interesante (usaron conv2d y _linear )

RECLAMACIÓN: Sin embargo, creo que hay un potencial mal uso de su modelo porque en el contexto de su modelo seq2seq, se presta atención a toda la salida del codificador, sin tener en cuenta si la entrada fue rellenada. Por lo tanto, para un USO CORRECTO del Atención_deocder, no use secuencias de pad en el codificador … sí, es bastante restrictivo!

Deep LearningMachine LearningTensorFlow

Related Content

¿Qué tan complejo debe hacer un corrector ortográfico básico a través del procesamiento del lenguaje natural para verificar los nombres de los hoteles?

¿Por qué usar Kohonen SOMs sobre K-means, o viceversa?

Como principiante en Deep Learning hoy, ¿qué marco debo usar?

¿Por qué el aumento de gradiente funciona tan bien para tantos problemas de Kaggle?

¿Cuáles son las falacias comunes de minería de datos?

¿Cuál es la diferencia entre el aprendizaje por refuerzo y la optimización de caja negra?

¿Cuál es el mejor enfoque para aprender sobre los algoritmos de redes neuronales de predicción del mercado de valores?

More Interesting

¿Qué le gustaría en una aplicación de aprendizaje de idiomas?

Dada una oración, quiero encontrar la emoción de la persona que la dijo. ¿Cómo puedo hacer esto?

¿Conoces algún software que implemente cálculos de los últimos k vectores singulares de matriz dispersa de entrada? Solía irlba, pero que yo sepa, solo calcula los primeros k vectores singulares

¿Qué significa una probabilidad gaussiana en el clasificador bayesiano ingenuo gaussiano?

¿Qué universidades de la India son buenas para realizar investigaciones en el aprendizaje por refuerzo?

¿Qué tan bueno es el ADVI en STAN en la práctica?

¿Es malo tener una gran cantidad de funciones en Machine Learning?

¿Qué es una red neuronal deconvolucional?

¿Cuál es la posibilidad de hacer una máquina de pensamiento real?

¿El aprendizaje automático es un subconjunto de la ciencia de datos?

Cómo reducir la dimensionalidad en la agrupación promedio global para que coincida con el tamaño de softmax

¿Qué has aprendido haciendo investigación?

¿La normalización de lotes hará la diferencia al entrenar con tamaño de lote = 1?

¿Cuál es la diferencia entre la regularización y el sesgo inductivo en el aprendizaje automático?

Visión por computadora: ¿Cuáles son los problemas abiertos para la recuperación de imágenes?

Web Analytics