Cómo usar la red neuronal de retardo de tiempo para la clasificación del conjunto de datos MNIST

Dado que las redes neuronales de retardo de tiempo (TDNN) requieren una entrada secuencial con cierto retraso, esta es una idea.

Dada una cuadrícula de entrada MNIST que es [matemática] 28 × 28 [/ matemática] utilice una ventana deslizante de muestreo de tamaño [matemática] w × h [/ matemática] donde [matemática] w <= 28 [/ matemática] y [matemática] h <= 28 [/ matemáticas]. Esto significa que la ventana se escaneará:

[matemáticas] P = [/ matemáticas] [matemáticas] (28 – w + 1) × (28 – h + 1) [/ matemáticas]

Posiciones, comenzando desde la esquina superior izquierda hasta la esquina inferior derecha. Esto produce entradas secundarias [matemáticas] P [/ matemáticas] para un solo dígito MNIST.

Si asumiendo que [math] w [/ math] y [math] h [/ math] son ambos iguales a 14, cada dígito MNIST produce subinsumos [math] 15 × 15 [/ math] en los que podemos introducir un retraso [math] t_ {d} [/ math] entre cada entrada secundaria antes de alimentar al TDNN, por lo tanto, deliberadamente cambiando un dígito MNIST espacial en una señal espacial-temporal que el TDNN puede procesar.

También es posible utilizar una ventana [matemática] w = 28 [/ matemática] y [matemática] h = 28 [/ matemática] para obtener una sola entrada secundaria. Esto efectivamente colapsa el TDNN a una red neuronal convencional.

Espero que esto ayude.

Aprendizaje automáticoAprendizaje profundoClasificaciónInteligencia ArtificialRedes neuronales artificialesRedes neuronales recurrentes

Related Content

Cómo conseguir un trabajo de nivel de entrada en India en el campo de la robótica, la inteligencia artificial o el aprendizaje automático

¿Cuáles son algunas buenas ideas para proyectos de aprendizaje automático? Yo uso Python

Cómo evaluar la precisión del entrenamiento para una red neuronal con una capa oculta

¿Por qué la longitud desigual del texto es un problema en el procesamiento del lenguaje natural?

¿Cómo se compara el paquete de aprendizaje profundo Mozi con Caffe o Torch7?

¿Es una exageración aplicar un conjunto de redes neuronales?

¿Puedes explicar el descenso coordinado en términos simples?

No estoy seguro de que MNIST sea el mejor conjunto de datos para probar TDNN, porque es, bueno, ¿sin estructura temporal para modelar? ¿Para qué exactamente estás tratando de usar tu red?

Chomba Bupe

More Interesting

¿Cómo trata Google Translate u otra traducción en línea con palabras que no existen en el otro idioma?

¿Cuál es la diferencia entre el descenso en gradiente y el descenso coordinado?

¿Cuál es el mejor método de extracción de características para OCR en texto chino escrito a mano?

En Tensorflow: ¿qué tipo de red neuronal debo usar?

¿Qué es el análisis de componentes principales y cuántas variables se pueden usar para PCA?

¿Cuál sería un buen proyecto de PNL?

¿Son todos los problemas de programación cuadrática convexos?

Cómo construir un sistema de recomendación de itinerario basado en las preferencias del usuario

¿Cómo aprendo el aprendizaje automático y el procesamiento de imágenes para aplicaciones móviles? Por ejemplo, para usar los mismos efectos de filtro en aplicaciones iOS y Android, ¿debería usar Python?

¿Cuál es el algoritmo detrás de LinkedIn Pulse?

¿Qué es mejor que el aprendizaje profundo?

¿Cuál es la forma correcta de verificar si mi fórmula de gradiente es correcta o no?

¿Cuál es el propósito de AdaGrad para la formación decente de la red neuronal de gradiente estocástico?

¿Cuándo debo usar la asignación de Dirichlet latente en la minería de texto? ¿Es bueno usarlo para un sistema que requiere alta precisión, como un sistema de detección de fraude?

Astronomía: ¿Cómo se puede usar el aprendizaje automático para la clasificación de galaxias?

Web Analytics