Defensa / fabricación / robótica, etc. regularmente hacen esto. El método no es como lo hacemos, ya que procesa matrices de píxeles y busca áreas limitadas de objetos de píxeles relacionados. Puede buscar una imagen real, pero luego el tamaño / orientación puede variar y, por lo tanto, la correlación puede ser difícil. La asociación es realizada por el programa (usando algoritmos de procesamiento de imágenes establecidos como convolución y correlación) que se dirige a buscar cosas. Si las cosas que está buscando son elementos regulares bien definidos, entonces la tarea es relativamente fácil. Las placas de circuito se pueden unir con componentes fijos y brazos de robot controlados numéricamente, etc. Pero esto no es AI. Clasificación de objetos en imágenes realizada mediante procesamiento de imágenes convencional; de nuevo, no es AI.
Los sistemas basados en computadora no “ven” la imagen que procesan, están utilizando programas que han sido definidos para realizar la tarea sin el beneficio de comprender la realidad de la imagen.
El sistema de IA actualmente utiliza el tipo de procesamiento de imágenes anterior. Si se utilizan redes neuronales, entonces el problema de la normalización y la orientación debe ser entrenado en las redes; este es un ejercicio significativo y puede dejar a la red incapaz de “reconocer” cualquier otra cosa. La red clasifica efectivamente las muestras de imágenes.
- ¿Cuál es el problema de 'morir ReLU' en las redes neuronales?
- ¿Por qué dijo Elon Musk que hay un "posible resultado peligroso" para lo que está haciendo la empresa Vicarious?
- ¿Puedo obtener un M.Tech en inteligencia artificial de IIT además de completar mi BE en electrónica e instrumentación?
- ¿Pueden los submarinos nadar?
- ¿Cuáles son algunos ejemplos de 'startups de aprendizaje automático' orientadas al consumidor?
Para construir una IA que “vea” sus imágenes de la manera que lo hacemos y, por lo tanto, pueda separar todos los componentes con poco procesamiento aún no se ha logrado. Esto aún no se ha entendido y probablemente requiere un tipo diferente de arquitectura de un sistema básico de computadora + cámara. Entonces la respuesta es sí pero no. Para tener una idea del problema.
lea Qualia (Stanford Encyclopedia of Philosophy)
Este es un análisis filosófico, pero es suficiente para mostrar que el problema de ver (o sentir, etc.) aún no se comprende, por lo que una solución basada en computadora aún no está a la vuelta de la esquina y quizás nunca con soluciones basadas en computadora.
Por lo tanto, puede escribir un programa para detectar y asociar un objeto con una etiqueta adecuada, pero no de la manera en que lo hacemos.