¿Cuán cercanos / similares son el procesamiento de imágenes digitales y la visión por computadora? ¿Cuál es más difícil / importante?

El procesamiento de imágenes , como su nombre indica, está involucrado con el procesamiento de imágenes digitales. Los algoritmos para el procesamiento de imágenes toman una imagen como entrada y producen otra imagen como entrada. Los ejemplos de algunas operaciones comunes de procesamiento de imágenes incluyen compresión, restauración y mejora.

La visión por computadora , por otro lado, está involucrada en la construcción de sistemas que permiten a las computadoras emular la visión humana. Las salidas de los algoritmos de visión por computadora son alguna forma de datos o símbolos cuyo significado puede ser interpretado por humanos. La mayoría de los sistemas de visión utilizan uno o más algoritmos de procesamiento de imágenes.

Por ejemplo, considere el problema del reconocimiento de dígitos escritos a mano, un problema bastante común de la visión por computadora. Los componentes de procesamiento de imagen de este problema incluirían conversión de espacio de color, ecualización de histograma, mejora de imagen mediante eliminación de ruido o normalización de tamaño. Una vez que nuestra imagen pasa por estos pasos de preprocesamiento, se vuelve adecuada para nuestro reconocedor (componente de visión por computadora), que puede ser una red neuronal que clasifica nuestra imagen de entrada preprocesada en uno de los 10 dígitos.

Por lo tanto, diría que estos dos campos son bastante cercanos en el sentido de que Vision abarca el procesamiento de imágenes.

Investigación en ciencias de la computaciónProcesamiento de imágenesVisión por computadora

¿Es la visión por computadora un campo de investigación sobrevalorado?

¿Cuáles son actualmente los temas candentes en la investigación en informática?

¿Qué opinas sobre la video conferencia de visión por computadora de William Hoff?

¿Cuáles son algunos buenos temas de investigación de secundaria en el procesamiento de imágenes?

¿Con qué frecuencia se utilizan los algoritmos en la ingeniería de software?

¿Cómo funciona el PageRank?

El advenimiento de la visión por computadora y el procesamiento de imágenes tiene como objetivo principal proporcionar a una máquina / computadora el sentido de ‘visión’. En resumen, su objetivo es replicar el funcionamiento del sistema de visión de los seres vivos en las máquinas. Aunque no estamos mucho más cerca de eso, los problemas de visión varían desde el posicionamiento del sensor de visión (ojo análogo) correctamente hacia cualquier escena para analizar la escena, detectar / reconocer / rastrear objetos en la escena que se está viendo (mucho más, por supuesto) )

Los seres vivos tienen sus sensores de visión (es decir, ojos) evolucionados naturalmente para funcionar según los requisitos de su vida. Pero se necesita mucho estudio para modelar un sensor artificial (una cámara, ya que se puede hacer que tengan sentido en una amplia gama de espectro), las especificaciones de diseño, aseguran que funcione correctamente. Ahora la ciencia de la visión por computadora comienza con el estudio de la cámara, la forma en que captura la escena, etc.

La cámara, que se supone configurada, la imagen que se está capturando, nos queda con una serie de números que representan la información en la imagen. Pero, los seres vivos usan mucho conocimiento previo para interpretar estas imágenes. Por ejemplo, es fácil para nosotros mirar una imagen y encontrar dónde está presente un objeto en ella. Pero para una computadora, se requieren ciertos procedimientos para realizar la misma tarea. Por lo tanto, en la mayoría de los casos, los sistemas de visión artificial están orientados a la aplicación en lugar de ser de uso general como los humanos.

El procesamiento digital de imágenes (DIP) comprende los procedimientos / técnicas utilizados para manipular la imagen, con el fin de producir una imagen (salida) en la forma requerida o para extraer cierta comprensión de alto nivel de la imagen. Esto podría abarcar desde simples técnicas de filtrado de imágenes para producir imágenes más atractivas hasta compresión de imágenes y técnicas de alto nivel para determinar el tamaño, la forma y relacionar objetos. Las técnicas de visión por computadora (CV) de bajo nivel se superponen casi por completo con DIP. La detección o segmentación de objetos, clasificación, descripción, etc. son algunos de los ejemplos para ello.

El CV de nivel superior intenta extraer y ordenar la información de los pasos DIP y finalmente intenta comprender la imagen. Se requieren grandes cantidades de datos para dicho análisis y CV utiliza reconocimiento de patrones y técnicas de IA para lograr los objetivos. El requisito de algoritmos más precisos y rápidos siempre ha llevado a la comunidad científica a implementar los conceptos tomados de diferentes campos juntos y extender las aplicaciones de Visión por computadora / Procesamiento de imágenes.

Por lo tanto, tanto DIP como CV se han desarrollado estrechamente y su importancia radica en las aplicaciones que exigen el uso de técnicas específicas de ambos campos.

Samyak Datta

More Interesting

¿En qué tipo de proyectos personales puedo trabajar para ayudar a mi solicitud de escuela de posgrado CS (tengo 2 años)?

¿Cuál es la intuición detrás de la computación de modelado?

¿Qué programa es mejor: UT Dallas o la Universidad de Edimburgo para una pista ML / NLP?

¿Cuál es la mejor manera de mostrar resultados para un trabajo de informática?

¿Cuáles son las áreas famosas de Física que se cruzan con CS o Ingeniería de Software?

¿Hay alguna idea en criptografía inspirada en la biología?

¿Cuáles son las ideas que puedo investigar?

¿Qué se encuentra en la primera línea de Machine Learning Research?

En la investigación de CS, ¿cuál es la relación de pensamiento a implementación?

¿Cuáles son algunos temas de investigación en ingeniería informática?