¿Cómo funciona la extracción de características en el procesamiento de imágenes?

Cuando dices Procesamiento de imágenes, supongo que estás hablando de redes neuronales convolucionales. Estas redes están hechas específicamente para el procesamiento de imágenes y la extracción de características.

Lo que hacen estas redes es que tienen una ventana deslizante. El tamaño es muy pequeño (5px x 5px) y está especificado por el programador.

Ahora, cuando entrene esto en una imagen, la ventana deslizante, como su nombre indica, comienza a deslizarse horizontalmente. Comienza desde la parte superior izquierda de la imagen y se mueve hacia el extremo derecho. Luego baja una fila y sigue moviéndote así.

Ahora, el papel principal de la ventana deslizante es que cada vez que encuentra un gran cambio en la variación en esa ventana, toma esa característica y la guarda.

Así es como funciona una red convolucional.

Si entra en el reconocimiento facial, las características genéricas son, la frente, los ojos, el área de la nariz, etc.

La extracción de características comienza a partir de un conjunto inicial de datos medidos y crea valores derivados (características) destinados a ser informativos y no redundantes, lo que facilita los pasos de aprendizaje y generalización posteriores y, en algunos casos, conduce a mejores interpretaciones humanas. La extracción de características está relacionada con la reducción de dimensionalidad.

Cuando los datos de entrada a un algoritmo son demasiado grandes para ser procesados ​​y se sospecha que son redundantes (por ejemplo, la misma medición en pies y metros, o la repetitividad de las imágenes presentadas como píxeles), entonces se puede transformar en un conjunto reducido de características (también denominado un vector de características). La determinación de un subconjunto de las características iniciales se denomina selección de características . Se espera que las características seleccionadas contengan la información relevante de los datos de entrada, de modo que la tarea deseada se pueda realizar utilizando esta representación reducida en lugar de los datos iniciales completos.

More Interesting

¿En qué medida se puede utilizar el aprendizaje automático y la IA en la detección y el tratamiento del cáncer?

¿Las PGM son esenciales para el aprendizaje profundo?

¿Cuál es el progreso en visión artificial?

Siendo un principiante, ¿dónde debería comenzar a aprender Machine Learning?

¿Cómo escribirías un programa de aprendizaje automático desde cero?

¿Cuál es el tamaño del conjunto de datos de Cifar?

Si hay investigaciones que muestran que una máquina interactúa con un humano dentro de la realidad a través de una conciencia cuántica, ¿cómo se recibirá?

¿Cuál es la diferencia entre bootstrapping y validación cruzada?

¿Por qué una red neuronal no es propensa al sobreajuste a pesar de tener tantos parámetros?

¿Cómo responden las redes neuronales profundas para la clasificación de imágenes a las variaciones típicas de la imagen, como la iluminación, la distancia focal, etc.?

Redes neuronales artificiales: ¿Qué determina si un problema de clasificación no trivial para el aprendizaje profundo se puede dividir en capas convolucionales en lugar de capas completamente conectadas?

¿Es un 'predictor de la siguiente palabra' que hice el aprendizaje automático o el procesamiento del lenguaje natural?

¿Cuáles son las especificaciones de la computadora utilizada para la red neuronal convolucional?

¿Por qué un algoritmo evolutivo es un método inapropiado para usar cuando se busca una clave para descifrar un mensaje codificado cuando solo hay una respuesta correcta?

¿Se utilizan algoritmos básicos de CS en el aprendizaje automático?