Cómo crear un conjunto de datos a partir de imágenes

Depende de lo que desee hacer y del tipo de marco (por ejemplo, Tensorflow, Caffe, Pytorch, etc.) que esté utilizando. Ya hay muchos conjuntos de datos disponibles en línea. Por favor, eche un vistazo al siguiente enlace para inspiraciones:

ImageNet (para clasificación): ImageNet

KITTI (principalmente para detección): KITTI Vision Benchmark Suite

¿Por qué los LSTM generalmente se entrenan con backprop y no con EKF?
¿El sobreajuste en un conjunto de datos implica que el modelo realmente puede aprender y generalizar sobre ese conjunto de datos, pero desafortunadamente demasiado entrenado?
¿Qué enfoques utilizas para vectorizar funciones en Matlab?
¿Cuáles son las ventajas de las técnicas de aprendizaje automático sobre las técnicas de pronóstico tradicionales?
¿Cómo podría agrupar usuarios similares en el conjunto de datos MovieLens?

En general, para la clasificación, es bastante fácil, todo lo que necesita hacer es tener una imagen en un vector. Supongamos que desea clasificar imágenes de perros y gatos, puede conectarse a Internet y recopilar un montón de imágenes que contengan gatos y perros. Luego divide las imágenes en conjunto de entrenamiento y prueba, composición al 90% y 10% respectivamente. Después de eso, crea un archivo .csv con el siguiente formato

fila 0: [nombre de archivo] [isCat] [isDog] (encabezados de columna)

fila 1: cat_01.jpg 1 0

fila 2: dog_01.jpg 0 1

…

Este vector se conoce como codificación one-hot. Y ahora, tiene su conjunto de datos para la clasificación. Depende del marco de aprendizaje profundo que utilice, debe ajustarse aún más en consecuencia. Si tiene la intención de utilizar Tensorflow, puede consultar su sitio web para obtener más información.

Para la detección, Google ha lanzado su API de detección de objetos, codificada en Tensorflow y disponible de forma gratuita. Puedes echar un vistazo usando el siguiente enlace:

Tensorflow / modelos

Harrison ha escrito un tutorial sobre cómo usar esta API de detección de extremo a extremo con sus datos personalizados también. Asegúrese de revisarlo usando el enlace adjunto a continuación.

Tutoriales de programación de Python

Aprendizaje automáticoConjuntos de datosImágenes