Cómo pensar que el ‘problema de aprendizaje One Shot’ se resolverá con Deep Neural Network

Una forma es hacer esto mediante el aprendizaje de transferencia : capacite una red neuronal en datos o tareas similares (pero no iguales), y luego reutilice las funciones aprendidas en una tarea de una sola vez.

Un ejemplo fácil de explicar es las redes siamesas para el aprendizaje de una sola vez: una red neuronal se entrena en un gran conjunto de datos de símbolos dibujados a mano (llamado omniglot) para decidir si dos imágenes son del mismo símbolo o no.

Luego, para aprender de una sola vez, compara una imagen de prueba con varias imágenes, cada una de un símbolo diferente que nunca antes se había visto. Clasifica la imagen de prueba como el símbolo del conjunto de soporte que considera más probable que sea del mismo tipo. Esto puede obtener hasta un 92% de precisión en promedio (los humanos obtienen 95.5%)

Pero el omniglot es una tarea relativamente simple: el problema del aprendizaje de una sola vez aún está muy, muy lejos de ser “resuelto”.

More Interesting

¿Cuáles son algunas de las limitaciones o inconvenientes de las redes neuronales convolucionales?

¿Cuál es el mejor argumento en contra de no saber cómo usar una computadora porque él o ella no crecieron con ella?

El aprendizaje profundo hará que los humanos sean innecesarios para qué trabajos.

¿Por qué debería obtener el doble de RAM que la memoria total de mi GPU para construir una plataforma de aprendizaje profundo?

¿Por qué el escalado es importante para la clasificación SVM lineal?

¿Cuál es una explicación intuitiva del algoritmo wake-sleep?

Cómo calcular un puntaje usando la prueba de relación de distancia al vecino más cercano en MATLAB

¿Cuál es la mejor introducción al aprendizaje profundo para un estudiante graduado con experiencia en matemáticas y CS?

¿Amazon Web es una buena alternativa para que yo use redes neuronales si mi computadora no tiene suficiente energía?

¿Cuáles son algunos conjuntos de datos etiquetados disponibles públicamente que usan Kinect para su uso en la investigación de la visión por computadora?

¿Tiene sentido usar redes neuronales convolucionales en la identificación biométrica humana basada en ECG?

¿Cuáles son los pros y los contras de aprender ExpressJS?

Cómo configurar datos de entrenamiento para una red neuronal para generar valores de joystick basados ​​en una entrada de imagen

¿Cuál es la diferencia entre la deserción y la normalización de lotes?

¿Hay algún artículo que justifique la normalización de los valores de los elementos en los sistemas de recomendación?