Gran pregunta!
Las redes neuronales convolucionales, y más específicamente las capas convolucionales en redes neuronales, proporcionan una forma muy poderosa de extraer características de las imágenes . Una vez que la red ha extraído las características relevantes de una imagen, puede usarlas de la forma que desee. Aquí están algunos ejemplos:
- Clasifique una imagen de las entidades con una capa softmax. (Este es el uso de CNN más predominante)
- Clasifique un video usando un LSTM para procesar las funciones extraídas de la CNN.
- Genere una descripción de texto de la imagen utilizando las funciones con un LSTM. (Utilizado en subtítulos)
- Genere una imagen a partir de las características con convoluciones y escalado, como en Auto Encoders o Generative Adversarial Networks. (Utilizado en la coloración de imágenes, traducción de imágenes, eliminación de ruido , etc.)
- Agrupe sus imágenes con t-SNE en el espacio latente.
- Use las funciones para hacer búsquedas de imágenes.
¡La naturaleza modular del aprendizaje automático, y especialmente el aprendizaje profundo, le brinda muchas formas diferentes de usar CNN!
- ¿Los humanos son actualizadores bayesianos?
- ¿Cuáles son los mejores algoritmos de aprendizaje sin supervisión para la corrección ortográfica?
- ¿Vale la pena aprender Machine Learning (y AI) si quiero seguir la carrera de Ingeniero Embebido?
- ¿Cuál es la explicación intuitiva y práctica del algoritmo AdaBoost utilizado en el artículo de Viola-Jones sobre detección de rostros, en lenguaje moderadamente técnico?
- ¿Cuál es una forma intuitiva de explicar los resultados de la PCA?