El “Diagonal LSTM” se explica en la figura 3 del documento de píxeles RNN. Supongamos que i y j denotan el índice de fila y el índice de columna de una imagen. Básicamente, el Diagonal LSTM calcula x [i, j] como una función no lineal de x [i-1, j-1] y x [i, j-1]. Esta es mi comprensión de la última oración del subtítulo de que usan un núcleo de tamaño 2 × 1. Y lo hacen en paralelo calculando a lo largo de la diagonal. La figura no es conceptualmente diferente, es solo un detalle de ingeniería que muestra cómo preprocesaron la imagen y la enmascararon para tensorflow / caffe, de modo que se pudieran aplicar operaciones estándar columna por columna.
Basado en la redacción del documento, la diagonal BiLSTM esencialmente les permite calcular una estadística para una imagen desde un ángulo diferente, por lo que conceptualmente es como rotar una imagen 45 grados y ejecutar una “Columna LSTM” donde procesas una imagen columna por columna . Visto de esta manera, un LSTM diagonal es un truco rápido y eficiente para obtener un contexto diferente, y hay botones de ajuste como cuántos píxeles debe colocar en el núcleo convolucional que puede variar.
- ¿Cuáles son las ventajas de la regresión logística?
- Soy Editor de Adquisiciones y para obtener conocimiento y autoaprendizaje de análisis de datos y habilidades de aprendizaje automático. ¿Alguien podría ayudarme a trazar un plan?
- ¿Cuál es una variedad de problemas y problemas que pueden resolverse mediante la minería de datos y el aprendizaje automático? ¿Qué tipo de algoritmo se utiliza para qué tipo de problema?
- ¿Qué es la optimización submodular?
- Cómo hacer que una red neuronal funcione como PCA