¿Cómo ‘Diagonal BiLSTM’ calcula los estados diagonales a la vez y qué es diagonal?

El “Diagonal LSTM” se explica en la figura 3 del documento de píxeles RNN. Supongamos que i y j denotan el índice de fila y el índice de columna de una imagen. Básicamente, el Diagonal LSTM calcula x [i, j] como una función no lineal de x [i-1, j-1] y x [i, j-1]. Esta es mi comprensión de la última oración del subtítulo de que usan un núcleo de tamaño 2 × 1. Y lo hacen en paralelo calculando a lo largo de la diagonal. La figura no es conceptualmente diferente, es solo un detalle de ingeniería que muestra cómo preprocesaron la imagen y la enmascararon para tensorflow / caffe, de modo que se pudieran aplicar operaciones estándar columna por columna.

Basado en la redacción del documento, la diagonal BiLSTM esencialmente les permite calcular una estadística para una imagen desde un ángulo diferente, por lo que conceptualmente es como rotar una imagen 45 grados y ejecutar una “Columna LSTM” donde procesas una imagen columna por columna . Visto de esta manera, un LSTM diagonal es un truco rápido y eficiente para obtener un contexto diferente, y hay botones de ajuste como cuántos píxeles debe colocar en el núcleo convolucional que puede variar.

More Interesting

¿Por qué la deserción puede mejorar el problema de sobreajuste en redes neuronales profundas?

¿Cómo se puede imitar la intuición humana en los algoritmos de aprendizaje automático? ¿Es importante el modelado de la intuición en el aprendizaje profundo?

¿Qué significa el término 'soft-max' en el contexto del aprendizaje automático?

Los datos financieros fluyen como 'gatos que cambian sus caras porque las computadoras los reconocen en YouTube'. ¿Hay una solución a este problema?

¿El aprendizaje automático es un campo sobresaturado?

¿Existe alguna relación entre el aprendizaje automático y el campo de la electrónica analógica o digital?

¿Cuáles son los mejores software de aprendizaje automático de código abierto para reconocimiento facial?

Con suficiente capacitación, ¿puede el aprendizaje automático escribir una buena historia para un programa de televisión?

¿Por qué los científicos no definen la inteligencia de tal manera que pueda implementarse artificialmente en un software, como si pudiéramos crear luz artificialmente?

¿Cuál es la intuición detrás de llamar variables ortogonales como independientes? Proporcione una respuesta en el contexto del aprendizaje automático.

Inferencia bayesiana: si tuviera que trazar un millar de correos electrónicos basados ​​en "spaminess" utilizando un algoritmo simple de Naive Bayes para establecer la probabilidad de "spaminess" para el eje x, ¿cuál debería ser mi eje y?

En la capacitación de CNN, ¿también se actualizan los pesos correspondientes al mapa de características?

¿Puedo usar la agrupación (k-means, etc.) en un gran conjunto de datos para automatizar el proceso de búsqueda de similitudes y hacer recomendaciones?

¿Cuáles son las similitudes y diferencias entre los campos aleatorios condicionales (CRF) y las redes de Markov de margen máximo (M3N)?

¿Es el modelo de análisis factorial una versión multivariada del modelo de mezcla gaussiana?