¿Cuántas imágenes necesita un buen sistema de aprendizaje automático para aprender un nuevo concepto?

Prácticamente, un par de millones. Consideremos un detector de gatos, porque este es el que se encuentra en Internet. Todas las imágenes tendrán que ser “verificadas”, imágenes que se sabe que tienen gatos (o no gatos) con la ubicación del gato conocida. Las imágenes incluirán todas las variedades de gatos (diferentes colores, diferentes razas, diferentes edades, diferentes tamaños) en diferentes condiciones de iluminación, con diferentes niveles de ruido y distorsión óptica y algo de desenfoque. Gatos en primer plano y gatos en el fondo. No todas las imágenes contendrán gatos, algunas contendrán no gatos: perros más pequeños, conejos, zorros, mapaches, estatuas de gatos, dibujos de gatos, imágenes ocupadas sin animales. De los aproximadamente dos millones de imágenes, un millón se considerará el conjunto de entrenamiento y el otro millón el conjunto de prueba. Cada uno debe contener tipos similares de imágenes pero no las mismas imágenes; no puedes probar efectivamente en tu conjunto de entrenamiento. Si lo intentas, obtendrás una puntuación alta falsa. Con muchos años de esfuerzo (al menos dos, probablemente 8), debería poder obtener el puntaje en los 90 altos en el nivel de confianza. Parte de esto depende de su objetivo y qué error es peor: ¿es peor no identificar un gato real (falso negativo) o es peor identificar un gato que no es un gato (falso positivo)? Esto depende de su aplicación, y puede ajustar sus algoritmos en consecuencia. Esto es para software comercialmente viable. Como prueba de concepto, puede usar algunas decenas de miles de imágenes y pasar algunas semanas entrenando software comercial o de dominio público.

Related Content

¿Cuándo veremos una base teórica y una base matemática para el aprendizaje profundo?

¿Por qué eliges TensorFlow?

¿Cuáles son los conceptos básicos de los campos aleatorios condicionales?

¿Existe un puntaje general de 'utilidad' para el rendimiento de recuperación de información?

¿Cómo se compara el paquete de aprendizaje profundo Mozi con Caffe o Torch7?

¿Cuáles son las mejores conferencias sobre aprendizaje automático para el procesamiento de imágenes médicas en 2016?

Cómo entrenar a cualquier clasificador basado en características de texto en un documento EMR

Esto es muy específico del problema

Recientemente hemos creado un clasificador que puede clasificar ‘imágenes’ de series de tiempo utilizando una cantidad muy pequeña de imágenes por categoría. Esto está usando un SVM tradicional con una base de tipo wavelet

Los éxitos se basan en el hecho de que no necesitamos lidiar con distorsiones, rotaciones, etc., que aparecerían en una imagen natural. Las imágenes son solo una serie temporal, y son básicamente un montón de píxeles en blanco y negro, alineados en un eje, con algunas características conocidas.

Hemos tenido otros clientes que vienen a nosotros con problemas más difíciles, pero aún no tan difícil como lo que se puede resolver hoy usando el aprendizaje profundo a gran escala.

Leo Baldwin

More Interesting

¿Por qué los CNN son mejores en clasificación que los RNN?

¿Keras admitirá PyTorch como backend en el futuro?

Cómo comenzar con la visión por computadora

¿Cuáles son los temas candentes / nuevos en el aprendizaje estadístico?

¿Qué es una red neuronal convolucional?

Cuando implementa algoritmos de aprendizaje automático, ¿cómo puede saber si su algoritmo es el enfoque incorrecto, si necesita ajustar los parámetros o si hay un error en su código?

¿Cuáles son buenos recursos para aprender sobre la ejecución distribuida en redes neuronales profundas (MPI, allreduce, etc.)?

¿Qué tan difícil es aprender TensorFlow?

¿Por qué NP = P es tan difícil de resolver?

¿Puede el aprendizaje reforzado aprovechar la memoria o transferir el aprendizaje?

¿Cuál es el papel de la descomposición de Cholesky en la búsqueda de PDF normal multivariante?

¿Qué hace que los parámetros del modelo sean variables latentes?

Para un problema de clasificación supervisada, primero busque grupos a través de un algoritmo de aprendizaje no supervisado, y para los miembros en el mismo grupo, asigne la misma etiqueta según un voto mayoritario. ¿Funciona bien?

¿Cómo modifica una red neuronal su peso sin entrar en un efecto de ping-pong? La función de modificación de peso se basa en el error (l * e * o [1, 2]), por lo que los valores de error altos dan modificaciones de peso drásticas.

Cómo hacer una clasificación en tiempo real con CNN

Web Analytics