Quiero construir una herramienta para reconocer cierto objeto de una sola instancia como datos de entrenamiento. ¿Qué bibliotecas me pueden ayudar?

Lo que está buscando se llama detección de objetos a nivel de instancia. No necesita aprendizaje automático (ML) aquí, pero el enfoque para el reconocimiento de nivel de instancia es algo más sofisticado que la mayoría de los enfoques de ML. OpenCV es la mejor biblioteca para tal aplicación. Hay principalmente tres etapas en la detección / reconocimiento de objetos a nivel de instancia, suponiendo un objeto rígido que tenemos:

  1. Detección de puntos clave : hay varios detectores de puntos de características implementados en OpenCV, como los detectores harris corner o FAST (características de la prueba de segmento acelerado) que se pueden usar para encontrar puntos fácilmente localizables en las imágenes. En una imagen estándar típica de VGA puede haber alrededor de mil puntos clave.
  2. Extracción de descriptores : una vez más, hay muchos descriptores que están diseñados para capturar la información más importante de los parches alrededor de los puntos clave. Estos descriptores son normalmente [matemáticos] L_2 [/ matemáticos] normalizados e indexados en una estructura de datos de búsqueda como el árbol kd o el hash sensible a la localidad (LSH), esto se denomina aprendizaje diferido porque los descriptores se memorizan en esas estructuras de datos de búsqueda . En realidad, puede entrenar una red neuronal convolucional (CNN) utilizando CNN siameses para aprender una incrustación de descriptores para parches crudos alrededor de los puntos clave. Todavía necesita indexar las incrustaciones de vectores normalizados en una estructura de datos que se puede buscar para construir una base de datos modelo.
  3. Coincidencia y ajuste del modelo : los descriptores observados se comparan con la base de datos del modelo para resolver el problema de correspondencia y luego un modelo de movimiento como una homografía o transformación afín se ajusta a los puntos correspondientes utilizando algoritmos robustos como el algoritmo de consenso de muestra aleatoria (RANSAC) . El algoritmo RANSAC devuelve puntos internos y externos y, utilizando un análisis probabilístico de los valores internos y externos, el sistema puede decidir si la instancia del objeto está presente o no.

OpenCV es la mejor biblioteca porque todas esas funcionalidades se implementan allí.

Espero que esto ayude.

En primer lugar, de lo que estás hablando es de un solo aprendizaje y es probablemente uno de los problemas más difíciles en ML.

En segundo lugar, no elige una biblioteca y luego construye una solución dentro de las limitaciones de esa biblioteca, mira para ver qué estaba inactivo antes y desarrolla una solución, luego elige la biblioteca que mejor se adapta a usted y su solución elegida.

More Interesting

Cuando se crea una inteligencia artificial capaz de jugar StarCraft, a niveles sobrehumanos, ¿qué podrá hacer la IA, en general?

¿Qué métodos efectivos automatizados / arquitectónicos existen para detectar trolls en línea?

¿Qué universidad debo solicitar para el Máster en CS y la especialización en Inteligencia Artificial?

¿Cómo está transformando la inteligencia artificial la profesión jurídica?

¿Llegaremos a la era en que los robots pueden reemplazar a los humanos en la creación de robots?

¿Cuál es su proceso de pensamiento al elegir una arquitectura de red neuronal?

¿Cómo se puede desarrollar un algoritmo de aprendizaje automático?

¿Cuánta inteligencia artificial comprende realmente Elon Musk?

Cómo controlar remotamente una mano de robot de acuerdo con los movimientos de mi propia mano EXACTAMENTE igual

¿Qué requisitos tendría que cumplir la inteligencia artificial para ser considerado vivo?

¿Cuáles son los mejores cursos de aprendizaje automático y robótica?

Cómo escribir una aplicación de IA que lea todos los tipos de registros de miles de servidores, enviar de vuelta a un cerebro de análisis de ML y proporcionar respuesta a cada servidor

¿Cuáles son las expectativas equivocadas comunes sobre los chatbots?

¿Puede la inteligencia artificial construir una inteligencia humana millones de veces más inteligente?

¿Qué tan lejos estamos de un contestador automático de preguntas que podría responder a todas las preguntas sobre Quora casi tan bien como la mayoría de los humanos?