¿Cuál es el progreso en visión artificial?

Gracias por el A2A.

Realmente hay dos enfoques para la visión artificial, que yo llamaría biológicos y basados en ingeniería . Las redes neuronales u otros procesos estadísticos pueden extraer información de una manera un tanto vaga, cuadriculada e inspirada orgánicamente. O puede realizar algoritmos como encontrar círculos, líneas y comparar con formas 3D internas explícitamente definidas.

El aprendizaje profundo con redes neuronales convolucionales es la última tendencia emocionante en visión artificial. De alguna manera imitan cómo nuestros cerebros procesan información visual a través de muchas capas de neuronas. Utilizan algoritmos de aprendizaje automático para aprender a clasificar las imágenes. Por ejemplo, muestre miles y miles de imágenes de gatitos y cachorros al sistema y dígale si es un gatito o un cachorro cada vez. Luego, puede mostrarle una nueva imagen de un gatito o cachorro, una que no haya visto, y le puede decir cuál de los dos animales es con una precisión impresionantemente alta. Suena muy simple, porque un niño promedio de 2 años puede hacer eso, pero no es simple. Esa habilidad había confundido a los investigadores de IA durante más de medio siglo.

El enfoque de ingeniería para la visión artificial es extraer cosas como círculos y líneas, usando cosas como la transformación de Hough y luego procesar a un nivel superior en las formas primitivas que se han encontrado y las relaciones entre ellas. La coincidencia de plantillas es un proceso de nivel bastante bajo que encuentra patrones en una imagen basada en una plantilla de memoria. Estos se están volviendo bastante sofisticados, con plantillas que incluso provienen de objetos renderizados internamente en 3D.

¿Puedo crear un conjunto de datos y luego usarlo para evaluar un algoritmo de clasificación?

¿Podemos nombrar funciones de funciones en CRF como funciones de kernel como para SMV?

¿Qué es el aprendizaje automático?

¿Por qué las redes neuronales artificiales se usan ampliamente en la clasificación de imágenes?

¿Qué podría ser el trabajo de investigación sobre autómatas (TOC)?

¿Cuáles son los buenos pesos iniciales en una red neuronal?

La visión artificial es la capacidad de una computadora para “ver”. Un sistema de visión artificial emplea una o más cámaras de video, conversión de analógico a digital (ADC) y procesamiento de señal digital (DSP). Los datos resultantes van a una computadora o controlador de robot. La visión artificial es similar en complejidad al reconocimiento de voz.

Dos especificaciones importantes en cualquier sistema de visión son la sensibilidad y la resolución. La sensibilidad es la capacidad de una máquina para ver con poca luz o para detectar impulsos débiles en longitudes de onda invisibles. La resolución es la medida en que una máquina puede diferenciar entre objetos. En general, cuanto mejor es la resolución, más limitado es el campo de visión. La sensibilidad y la resolución son interdependientes. Todos los demás factores se mantienen constantes, aumentar la sensibilidad reduce la resolución y mejorar la resolución reduce la sensibilidad.

Los ojos humanos son sensibles a las longitudes de onda electromagnéticas que oscilan entre 390 y 770 nanómetros (nm). Las cámaras de video pueden ser sensibles a un rango de longitudes de onda mucho más amplias que esta. Algunos sistemas de visión artificial funcionan en longitudes de onda infrarroja (IR), ultravioleta (UV) o de rayos X.

La visión artificial binocular (estéreo) requiere una computadora con un procesador avanzado. Además, se requieren cámaras de alta resolución, una gran cantidad de memoria de acceso aleatorio (RAM) y programación de inteligencia artificial (AI) para la percepción de profundidad.

La visión artificial se utiliza en diversas aplicaciones industriales y médicas. Ejemplos incluyen:

Análisis de componentes electrónicos.
Identificación de firma
Reconocimiento óptico de caracteres
Reconocimiento de escritura a mano
Reconocimiento de objetos
Reconocimiento de patrones
Inspección de materiales
Inspección de divisas
Análisis de imagen médica.

El término visión artificial a menudo se asocia con aplicaciones industriales de la capacidad de una computadora para ver, mientras que el término visión artificial a menudo se usa para describir cualquier tipo de tecnología en la que una computadora tiene la tarea de digitalizar una imagen, procesar los datos que contiene y tomar algo tipo de acción

Matt Parsons

Los sistemas de visión artificial pueden realizar tareas repetitivas complejas con mayor precisión y consistencia. Los sistemas de visión artificial incluyen componentes como sensores de imagen, procesadores, PLC, capturadores de cuadros y más, que son impulsados por un paquete de software para ejecutar aplicaciones definidas por el usuario. Los sistemas de visión artificial también se emplean en aplicaciones que no son de inspección como guiar robots, recoger y colocar las piezas, dispensar líquidos y muchos más.

Obtenga más información sobre el progreso en visión artificial: los socios de Insight

Yu Jiahui

Como una mano verde, puedo decir algo sobre mi opinión.

En el progreso de la visión artificial, primero debe elegir la función adecuada, como HOG, BRISK, SIFT, SURF, etc.

Y luego necesitas hacer tu clasificador; por ejemplo, puede preparar muestras positivas y negativas tantas como sea posible, lo que le dice a las computadoras lo que está bien o mal.

Finalmente, ejecute su programa para identificar objetos.

Yu Jiahui

More Interesting

¿Por qué las RVM no son tan populares como las SVM?

¿Por qué la deserción puede mejorar el problema de sobreajuste en redes neuronales profundas?

¿Qué alternativas a las redes convolucionales para las tareas de aprendizaje automático de imágenes se están investigando ahora?

¿Cuál es la diferencia entre Empirical Bayes e inferencia bayesiana?

¿Cómo puedo medir la precisión de un sistema de recomendación?

¿Puede un desarrollador de aprendizaje profundo atrapar criminales que abusan de niños?

¿Cuál es la función de zeropad en CNN?

¿Qué es lo que más te gusta del aprendizaje automático?

¿Cuál es la relación entre visión artificial, inteligencia artificial de aprendizaje automático y aprendizaje profundo? ¿Son dependientes y están estrechamente vinculados?