¿Cuáles son buenas técnicas de aumento de datos para un conjunto de datos de imágenes pequeñas?

Aumentar pequeños conjuntos de datos es importante y desafiante. No está agregando mucha información nueva a la red, pero al aumentar los datos está entrenando a la red para que no ajuste demasiado su conjunto de datos con respecto al tipo de aumento.

En una tarea de clasificación de imágenes (por ejemplo, clasificación binaria de perro / gato), si gira la imagen en varios ángulos, está entrenando a la red para que sea invariable a la rotación de los objetos en las imágenes. (Lo mismo para augementation de escala / simulaciones de obstrucción / ruido aleatorio)

Entonces, aunque no se agrega nueva información “auténtica” a la red, el aumento de datos “sintéticos” agregado a la red puede mejorar los resultados obtenidos de la red y permitir la capacitación con menos datos.

Es importante tener en cuenta que el aumento solo es útil cuando es semánticamente correcto. No hay razón para aumentar las imágenes de los peatones que cruzan la calle para estar pies arriba cabeza abajo … en datos reales, tal escena es increíblemente improbable, ya que tal aumento de los datos de entrenamiento podría dañar sus resultados.

Buena suerte

Análisis de datosAprendizaje automáticoCiencia de datosdatosLista de preguntas

Related Content

¿Cuál es la proporción de creatividad vs trabajo de rutina en ciencia de datos?

¿Cuáles son las principales demostraciones de big data?

¿Cuáles son los datos más valiosos cuando un usuario aleatorio de Internet usa su sitio web?

¿Cuáles son algunas buenas conferencias en video sobre aprendizaje automático y aprendizaje profundo?

Si hiciera un curso de ciencia de datos en Hyderabad, ¿qué instituto sugeriría?

¿Cuáles son las principales herramientas de visualización de datos?

¿Por qué es tan importante el Big Data?

Intenté NNets enrevesadas para modelar datos de MNIST recientemente, y me ayudó en ese caso.

Sin el aumento de datos, me quedé atascado con una precisión de prueba del 99.3% por un tiempo … dada la tecnología que tenía disponible, etc.

Con el aumento de datos en los datos de entrenamiento en el mismo algoritmo, pude exprimir un poco más y llegué al 99.5%.

MNIST tiene un total de 70K registros etiquetados, disponibles para entrenamiento y prueba. Por lo tanto, el aumento de datos para un algoritmo hambriento de datos como el anterior también tenía sentido intuitivo.

Intenté los siguientes aumentos de datos: rotar a izquierda y derecha, hacer zoom, estirar vertical y horizontalmente, acercar / alejar, deformaciones elásticas. Esto último es particularmente interesante, ya que, en un sentido amplio, nos permite crear más variantes de escritura a mano legítima que las originalmente disponibles en el entrenamiento.

Satendra Kumar

More Interesting

¿Cuál es el papel de un científico de datos en Quora?

¿Existe alguna metodología como OOP que guíe cómo diseñar un software de procesamiento de datos?

¿Qué son la función de descenso de gradiente y costo en la regresión logística?

¿Cuál es el criterio de elegibilidad para aprender análisis de big data?

¿Cuáles son los conceptos erróneos comunes sobre la ciencia de datos?

¿En qué consiste la minería de datos?

¿Cómo se hace una base de datos que está 'en' el entorno Hadoop?

¿Cuál es el mejor lenguaje de programación para la ciencia de datos?

¿Cuáles son los beneficios de la remodelación de datos?

¿Cómo juegan un papel los datos y el análisis en el negocio de un cliente?

¿Cuánto se relacionan estos términos como ciencia de datos, aprendizaje automático, inteligencia artificial e internet de las cosas con el mundo venidero? ¿De dónde puedo aprender estos temas? ¿Cuánto están relacionados con la ingeniería de comunicación electrónica?

Cómo aprender a recuperar, insertar, buscar datos en Big Data

¿Cuál sería una buena pila tecnológica para aprender para un ingeniero de datos principiante?

¿Cómo es ser un Data Science Manager?

Soy un estudiante de 4º año de ingeniería química en India (IIT). Deseo obtener un título en ciencia de datos en los Estados Unidos. ¿Alguien puede sugerir buenas universidades adecuadas para mi perfil?

Web Analytics