Este es un proceso bastante general para todas las redes neuronales convolucionales. Cambia el tamaño de la imagen de entrada al tamaño especificado antes de pasarla por la red. Esto es parte de la etapa de preprocesamiento.
Una forma sencilla de hacerlo es cambiar el tamaño del lado más corto de una imagen a 256 manteniendo la relación de aspecto y recortar la región central de tamaño 256 * 256 (recuerde que el lado más largo sería> 256, por lo que debe recortar a lo largo de este eje). La imagen final mantiene la relación de aspecto de la imagen original. Otra forma más simple es cambiar el tamaño de la imagen a 256 * 256, pero se pierde la relación de aspecto al hacer esto.
Existen otros métodos que generan 10 o más imágenes de una sola imagen y las utilizan para el entrenamiento (aumento de imagen), pero lo mencionado anteriormente debería ser suficiente.
- ¿Cómo podemos hacer una buena predicción usando el aprendizaje profundo MXNet R?
- ¿Cómo son los cursos en edX sobre aprendizaje automático, ingeniería artificial y robótica para el empleo?
- ¿Sigue siendo el curso de aprendizaje automático de Andrew Ng el mejor curso de aprendizaje automático disponible?
- ¿Cuáles son los temas candentes / nuevos en el aprendizaje estadístico?
- ¿Cuál es la diferencia entre análisis de datos, ciencia de datos, big data y aprendizaje automático?