Cómo crear un conjunto de datos a partir de imágenes

Depende de lo que desee hacer y del tipo de marco (por ejemplo, Tensorflow, Caffe, Pytorch, etc.) que esté utilizando. Ya hay muchos conjuntos de datos disponibles en línea. Por favor, eche un vistazo al siguiente enlace para inspiraciones:

ImageNet (para clasificación): ImageNet

KITTI (principalmente para detección): KITTI Vision Benchmark Suite

En general, para la clasificación, es bastante fácil, todo lo que necesita hacer es tener una imagen en un vector. Supongamos que desea clasificar imágenes de perros y gatos, puede conectarse a Internet y recopilar un montón de imágenes que contengan gatos y perros. Luego divide las imágenes en conjunto de entrenamiento y prueba, composición al 90% y 10% respectivamente. Después de eso, crea un archivo .csv con el siguiente formato

fila 0: [nombre de archivo] [isCat] [isDog] (encabezados de columna)

fila 1: cat_01.jpg 1 0

fila 2: dog_01.jpg 0 1

Este vector se conoce como codificación one-hot. Y ahora, tiene su conjunto de datos para la clasificación. Depende del marco de aprendizaje profundo que utilice, debe ajustarse aún más en consecuencia. Si tiene la intención de utilizar Tensorflow, puede consultar su sitio web para obtener más información.

Para la detección, Google ha lanzado su API de detección de objetos, codificada en Tensorflow y disponible de forma gratuita. Puedes echar un vistazo usando el siguiente enlace:

Tensorflow / modelos

Harrison ha escrito un tutorial sobre cómo usar esta API de detección de extremo a extremo con sus datos personalizados también. Asegúrese de revisarlo usando el enlace adjunto a continuación.

Tutoriales de programación de Python

More Interesting

¿Por qué la optimización convexa es tan importante en el aprendizaje automático?

En la Bayes Net dada, ¿existe un caso de explicación del fenómeno?

¿Qué método de aprendizaje profundo es el más adecuado para PNL?

¿Cómo se puede utilizar la máquina de Boltzmann restringida en problemas de clasificación?

¿Qué les falta a las redes de confrontación para que realmente modelen una representación del mundo?

Cómo calcular un puntaje usando la prueba de relación de distancia al vecino más cercano en MATLAB

¿Cuáles son los algoritmos disponibles para diseñar un detector de actividad de habla hablada cercana?

Cómo detectar si a una cadena le faltan espacios entre palabras

¿Cuál es una explicación intuitiva de la aproximación de la función de codificación de mosaico en el aprendizaje por refuerzo?

Cómo implementar el análisis de sentimientos en proyectos de retroalimentación de clientes

¿Qué motor de recomendación / personalización estándar ofrece recomendaciones utilizando tanto el aprendizaje automático como la entrada manual?

¿Cuáles son los mejores algoritmos para construir sistemas de recomendación?

El problema de los bandidos armados múltiples discutido en el libro de Sutton y Barto, usa 2000 ensayos y 1000 jugadas. Cuál es la diferencia entre esto?

¿Cómo se asegura que el aprendizaje automático no aprenda la correlación cuando no hay causalidad, especialmente para la predicción?

¿Es posible entrenar a un RNN en una sola secuencia extremadamente larga?