¿Cuáles son los algoritmos actuales de última generación para la detección de objetos en 2017?

Las dos técnicas populares de detección de objetos a partir de 2017 serían

  1. Detector SingleBox MultiBox (58 FPS y 72.1% mAP)
  2. Mejor, más rápido, más fuerte (Yolov2 – 67 FPS y 76.8% mAP). La versión anterior yolov1 también podía ejecutarse en tiempo real y detectar múltiples clases, pero tenía una precisión menor.

Ambos son muy populares. Para el vehículo autónomo en el que estamos trabajando, utilizamos Yolov1 para la detección y el seguimiento de objetos. Teniendo en cuenta que Yolov1 era lo suficientemente bueno, yolov2 sería un candidato fuerte, sin duda.

SSD Multibox es un enfoque popular también, pero no lo he usado yo mismo. Puede encontrar artículos medianos sobre personas que usan SSD para sus proyectos. Sin embargo, ambos son fuertes contendientes.

Las implementaciones de Mulitple TensorFlow y Keras están disponibles en Github.

  1. balancap / SSD-Tensorflow
  2. thtrieu / darkflow

El siguiente artículo ofrece comparaciones prácticas para las técnicas más avanzadas:

https://arxiv.org/pdf/1611.10012

La implementación de comparación se puede encontrar en lo siguiente:

Sobrealimente sus modelos de visión artificial con la API de detección de objetos TensorFlow

Gracias a Jonathan Huang et al., 2017.

La forma más fácil de verificar es echar un vistazo en las tablas de clasificación para las competiciones públicas: MS-COCO, KITTI, Pascal VOC.

More Interesting

¿Cómo se ajustan los pesos en una red neuronal mientras estoy entrenando la red?

Cómo llegar a un problema de aprendizaje automático para un proyecto personal

PCA, 2DPCA vs PCA multilineal: ¿Por qué las imágenes se vectorizan antes de realizar PCA, ICA o LDA, etc.? ¿Por qué no simplemente concatenar imágenes 2D en una matriz?

¿Cómo se puede interpretar el teorema de Bayes en términos de inferir relaciones causales en los datos?

¿Cómo realizo la selección de funciones?

¿Cuál es la diferencia entre la anotación automática de imágenes y la recuperación de imágenes?

¿Es estúpido cambiar de trabajo de programación en C a aprendizaje automático?

¿Qué es el aprendizaje automático basado en modelos?

¿Qué es la selección de variables en bloques cuando se hace un análisis de regresión?

¿Qué son los sistemas de detección?

¿Cuál es el método del núcleo? ¿Cómo se usa en los sistemas de recomendación?

¿Cuáles son algunos métodos de aprendizaje automático supervisados ​​y no supervisados ​​para trabajar con conjuntos de datos que tienen características muy grandes y un bajo número de muestras?

¿Cómo funciona la codificación de características de alta cardinalidad con regresión de cresta?

¿Cuáles son las características únicas de una red neuronal en comparación con otras técnicas de aprendizaje automático?

¿Cuál es la diferencia entre la regularización y el sesgo inductivo en el aprendizaje automático?