¿Cuál es el progreso en visión artificial?

Gracias por el A2A.

Realmente hay dos enfoques para la visión artificial, que yo llamaría biológicos y basados ​​en ingeniería . Las redes neuronales u otros procesos estadísticos pueden extraer información de una manera un tanto vaga, cuadriculada e inspirada orgánicamente. O puede realizar algoritmos como encontrar círculos, líneas y comparar con formas 3D internas explícitamente definidas.

El aprendizaje profundo con redes neuronales convolucionales es la última tendencia emocionante en visión artificial. De alguna manera imitan cómo nuestros cerebros procesan información visual a través de muchas capas de neuronas. Utilizan algoritmos de aprendizaje automático para aprender a clasificar las imágenes. Por ejemplo, muestre miles y miles de imágenes de gatitos y cachorros al sistema y dígale si es un gatito o un cachorro cada vez. Luego, puede mostrarle una nueva imagen de un gatito o cachorro, una que no haya visto, y le puede decir cuál de los dos animales es con una precisión impresionantemente alta. Suena muy simple, porque un niño promedio de 2 años puede hacer eso, pero no es simple. Esa habilidad había confundido a los investigadores de IA durante más de medio siglo.

El enfoque de ingeniería para la visión artificial es extraer cosas como círculos y líneas, usando cosas como la transformación de Hough y luego procesar a un nivel superior en las formas primitivas que se han encontrado y las relaciones entre ellas. La coincidencia de plantillas es un proceso de nivel bastante bajo que encuentra patrones en una imagen basada en una plantilla de memoria. Estos se están volviendo bastante sofisticados, con plantillas que incluso provienen de objetos renderizados internamente en 3D.

La visión artificial es la capacidad de una computadora para “ver”. Un sistema de visión artificial emplea una o más cámaras de video, conversión de analógico a digital (ADC) y procesamiento de señal digital (DSP). Los datos resultantes van a una computadora o controlador de robot. La visión artificial es similar en complejidad al reconocimiento de voz.

Dos especificaciones importantes en cualquier sistema de visión son la sensibilidad y la resolución. La sensibilidad es la capacidad de una máquina para ver con poca luz o para detectar impulsos débiles en longitudes de onda invisibles. La resolución es la medida en que una máquina puede diferenciar entre objetos. En general, cuanto mejor es la resolución, más limitado es el campo de visión. La sensibilidad y la resolución son interdependientes. Todos los demás factores se mantienen constantes, aumentar la sensibilidad reduce la resolución y mejorar la resolución reduce la sensibilidad.

Los ojos humanos son sensibles a las longitudes de onda electromagnéticas que oscilan entre 390 y 770 nanómetros (nm). Las cámaras de video pueden ser sensibles a un rango de longitudes de onda mucho más amplias que esta. Algunos sistemas de visión artificial funcionan en longitudes de onda infrarroja (IR), ultravioleta (UV) o de rayos X.

La visión artificial binocular (estéreo) requiere una computadora con un procesador avanzado. Además, se requieren cámaras de alta resolución, una gran cantidad de memoria de acceso aleatorio (RAM) y programación de inteligencia artificial (AI) para la percepción de profundidad.

La visión artificial se utiliza en diversas aplicaciones industriales y médicas. Ejemplos incluyen:

  • Análisis de componentes electrónicos.
  • Identificación de firma
  • Reconocimiento óptico de caracteres
  • Reconocimiento de escritura a mano
  • Reconocimiento de objetos
  • Reconocimiento de patrones
  • Inspección de materiales
  • Inspección de divisas
  • Análisis de imagen médica.

El término visión artificial a menudo se asocia con aplicaciones industriales de la capacidad de una computadora para ver, mientras que el término visión artificial a menudo se usa para describir cualquier tipo de tecnología en la que una computadora tiene la tarea de digitalizar una imagen, procesar los datos que contiene y tomar algo tipo de acción

Los sistemas de visión artificial pueden realizar tareas repetitivas complejas con mayor precisión y consistencia. Los sistemas de visión artificial incluyen componentes como sensores de imagen, procesadores, PLC, capturadores de cuadros y más, que son impulsados ​​por un paquete de software para ejecutar aplicaciones definidas por el usuario. Los sistemas de visión artificial también se emplean en aplicaciones que no son de inspección como guiar robots, recoger y colocar las piezas, dispensar líquidos y muchos más.

Obtenga más información sobre el progreso en visión artificial: los socios de Insight

Como una mano verde, puedo decir algo sobre mi opinión.

En el progreso de la visión artificial, primero debe elegir la función adecuada, como HOG, BRISK, SIFT, SURF, etc.

Y luego necesitas hacer tu clasificador; por ejemplo, puede preparar muestras positivas y negativas tantas como sea posible, lo que le dice a las computadoras lo que está bien o mal.

Finalmente, ejecute su programa para identificar objetos.