La detección y el seguimiento de objetos siguen siendo problemas difíciles incluso con el aprendizaje profundo (DL). Un sistema de seguimiento simple basado en el color que utiliza un filtro kalman puede hacer un seguimiento mucho mejor que un sistema DL como R-CNN, YOLO u otros métodos.
Simplemente porque la mayoría de los algoritmos de detección de objetos DL de última generación ni siquiera pueden manejar adecuadamente la oclusión / superposición severa. No pueden distinguir fácilmente dos objetos que están superpuestos u ocluidos severamente. Esto se debe a que estos sistemas no utilizan el proceso de asignación de características como en el sistema visual humano (HVS). La asignación de características ayuda mucho cuando se trata de localización de objetos y precisión de reconocimiento, pero actualmente no se implementa en sistemas DL.
Tomemos, por ejemplo, R-CNN basado en una red de propuesta de región (RPN) y YOLO (You Only Look Once) ambos usan cabezales de regresión de cuadro delimitador en algún lugar de la tubería, YOLO es más rápido pero con más tasas de detección falsas. Están diseñados para reconocer y localizar objetos, su sistema de localización es bastante tosco y, por lo tanto, no funcionan bien en objetos pequeños como las abejas.
- ¿Qué significa cuando obtengo buenos resultados de la medida F con un CV de 10 veces pero resultados pobres en los datos de la prueba, resultados similares si participo el conjunto de datos original en el conjunto de entrenamiento / validación? Obtengo buenos resultados en la validación pero malos resultados en el conjunto de pruebas.
- ¿Cuál es la maldición de la dimensionalidad?
- ¿Por qué el aprendizaje automático, las redes neuronales y otros enfoques de IA, por ejemplo, no se usan más ampliamente en las predicciones del mercado de valores?
- ¿Cómo se explica el aprendizaje automático y la inteligencia artificial a un niño de 5 años?
- ¿Dónde puedo obtener un conjunto de datos de notas de suicidio para fines de aprendizaje automático?
Para rastrear abejas tan pequeñas aquí es lo que pienso:
Use una red neuronal convolucional profunda previamente entrenada y, en lugar del seguimiento de color + filtro kalman, use las características de nivel medio de ese filtro previamente capacitado convNet + kalman para el seguimiento.
Reemplazar características de bajo nivel como el color con características de nivel medio o alto de un sistema DL en un sistema de seguimiento puede ayudar a que el sistema sea más confiable y más preciso.
Puede comenzar desde aquí Usar el filtro de Kalman para el seguimiento de objetos
Espero que esto ayude.