¿Cómo funciona la extracción de características en el procesamiento de imágenes?

Cuando dices Procesamiento de imágenes, supongo que estás hablando de redes neuronales convolucionales. Estas redes están hechas específicamente para el procesamiento de imágenes y la extracción de características.

Lo que hacen estas redes es que tienen una ventana deslizante. El tamaño es muy pequeño (5px x 5px) y está especificado por el programador.

Ahora, cuando entrene esto en una imagen, la ventana deslizante, como su nombre indica, comienza a deslizarse horizontalmente. Comienza desde la parte superior izquierda de la imagen y se mueve hacia el extremo derecho. Luego baja una fila y sigue moviéndote así.

Ahora, el papel principal de la ventana deslizante es que cada vez que encuentra un gran cambio en la variación en esa ventana, toma esa característica y la guarda.

Así es como funciona una red convolucional.

Si entra en el reconocimiento facial, las características genéricas son, la frente, los ojos, el área de la nariz, etc.

Aprendizaje automáticoArtificialExtracción de característicasProcesamiento de imágenesProgramación informáticaVisión

¿Cómo se pueden usar las redes neuronales recurrentes para predecir el género a partir de los nombres de pila?

¿Cómo se derivan las funciones de costo para las redes neuronales?

¿Cuáles son las principales diferencias entre la teoría de juegos y el aprendizaje por refuerzo?

¿Qué lenguaje es mejor para hacer big data y machine learning (en términos de rendimiento) Java o Python?

¿Debo hacer un gran proyecto de investigación de aprendizaje profundo con mi propio dinero (y tiempo), sin que me paguen, solo para que alguien pueda contratarme debido al trabajo?

¿Cómo podemos hacer csv o dataset textual a partir de imágenes?

La extracción de características comienza a partir de un conjunto inicial de datos medidos y crea valores derivados (características) destinados a ser informativos y no redundantes, lo que facilita los pasos de aprendizaje y generalización posteriores y, en algunos casos, conduce a mejores interpretaciones humanas. La extracción de características está relacionada con la reducción de dimensionalidad.

Cuando los datos de entrada a un algoritmo son demasiado grandes para ser procesados y se sospecha que son redundantes (por ejemplo, la misma medición en pies y metros, o la repetitividad de las imágenes presentadas como píxeles), entonces se puede transformar en un conjunto reducido de características (también denominado un vector de características). La determinación de un subconjunto de las características iniciales se denomina selección de características . Se espera que las características seleccionadas contengan la información relevante de los datos de entrada, de modo que la tarea deseada se pueda realizar utilizando esta representación reducida en lugar de los datos iniciales completos.

Saranya

More Interesting

¿En qué medida se puede utilizar el aprendizaje automático y la IA en la detección y el tratamiento del cáncer?

¿Las PGM son esenciales para el aprendizaje profundo?

¿Cuál es el progreso en visión artificial?

Siendo un principiante, ¿dónde debería comenzar a aprender Machine Learning?

¿Cómo escribirías un programa de aprendizaje automático desde cero?

¿Cuál es el tamaño del conjunto de datos de Cifar?

Si hay investigaciones que muestran que una máquina interactúa con un humano dentro de la realidad a través de una conciencia cuántica, ¿cómo se recibirá?

¿Cuál es la diferencia entre bootstrapping y validación cruzada?

¿Por qué una red neuronal no es propensa al sobreajuste a pesar de tener tantos parámetros?

¿Cómo responden las redes neuronales profundas para la clasificación de imágenes a las variaciones típicas de la imagen, como la iluminación, la distancia focal, etc.?