¿De dónde obtienen los sistemas de conducción autónomos sus datos de entrenamiento?

Para comprender esto en profundidad, es importante comprender los modelos de negocio adoptados por las empresas en el mundo de los sistemas de conducción autónoma (ADS).

Hay dos tipos de empresas ADS:

  1. Fabricantes de automóviles / OEM – Ej. Ford, GM (con Cruise Automation), Daimler, BMW, Tesla Toyota, etc.
  2. Software para ADS: Drive.ai, nuTonomy, Momenta, etc.

Las compañías de Tipo 1 tienen una enorme flota de sus automóviles en la carretera y solo caben en equipos y sensores en estos automóviles para registrar y recopilar datos en forma de imágenes / videos y luego etiquetar estos videos para entrenar a los modelos ML.

Las empresas tipo 2 no son propietarias de una flota, por lo que confían en sus clientes, que son las empresas tipo 1 para recopilar datos.

Ahora etiquetar millones de horas de datos de video es un proceso inmensamente complejo para cualquiera de los dos tipos de empresas y se debe elegir:

  1. Tipo de etiquetado
  2. La forma más eficiente de etiquetado (calidad, cantidad, tiempo y costo)

Los diferentes tipos de métodos de etiquetado son

  1. Cajas de límites 2D

2. Polígonos

3. Cuboides

4. segmentación semántica

5. Puntos y líneas

Aquí hay más detalles sobre cuándo y por qué se utilizan diferentes técnicas de etiquetado.

Se requiere una gran fuerza laboral para realizar estas anotaciones. Por lo tanto, la mayoría de las empresas configuran equipos offshore para realizar estas operaciones o colaboran con plataformas completamente administradas como Playment con una fuerza laboral de más de 300,000 anotadores calificados y herramientas de última generación para optimizar la calidad, el tiempo y el costo.

La generación de datos de capacitación de alta calidad a escala es una de las funciones más esenciales para cualquier empresa de ADS y la propiedad de estos conjuntos de datos de gran propiedad puede proporcionar una gran ventaja competitiva.

Todos los principales fabricantes de automóviles, así como los fabricantes de equipos originales, como MobilEye, han recopilado sus propios conjuntos de datos patentados, que a menudo son anotados por terceros (a menudo con sede en China). También algunos organismos gubernamentales como NHTSA en los Estados Unidos han registrado sus propios conjuntos de datos para diversas aplicaciones especializadas.

Solo hay unos pocos conjuntos de datos disponibles en el dominio público, recopilados por académicos. El más famoso y amplio entre estos es KITTI:

La suite de referencia KITTI Vision

Por lo general, de recogida privada.

Kitti mencionado por Zeeshan: aquí hay un nuevo conjunto de datos de comma.ai: commaai / research

More Interesting

¿Por qué el error cuadrático medio es equivalente a minimizar la entropía cruzada entre la distribución empírica y un modelo gaussiano?

¿Cómo representa doc2vec el vector de características de un documento? ¿Alguien puede explicar matemáticamente cómo se realiza el proceso?

¿Cuáles son las características de un motor BS4?

¿Qué es una red neuronal deconvolucional?

¿Los diferentes algoritmos de árbol de decisión ofrecen diferencias significativas en el rendimiento?

¿Cómo probar formalmente que el producto de dos núcleos es un núcleo? Si K1 (x, x1) y K2 (x, x2) son ambas funciones del núcleo, entonces K1 (x, x1) K2 (x, x2) también es un núcleo

Cómo preprocesar el conjunto de datos de correo electrónico de Enron

¿Cuál es el ejemplo de código más simple para redes neuronales recurrentes (RNN) en TensorFlow?

¿Cuál es la maldición de la dimensionalidad?

Cómo construir una aplicación de Android orientada al aprendizaje automático

¿Cuáles son algunas buenas ideas de proyectos o ejemplos para un proyecto de curso de Visión de Computadora basado en Aprendizaje Automático?

¿Cuál es la explicación de la causa de la explosión y desaparición del gradiente de red neuronal recurrente RNN?

¿Cuáles son las probabilidades de ingresar a un programa de posgrado de aprendizaje automático en una escuela superior si mi experiencia en investigación es en bioinformática y algo de experiencia en investigación en PNL?

Soy un ingeniero electrónico que conoce algoritmos de aprendizaje automático, big data, estadísticas, SQL, Matlab. ¿Puedo ser contratado como ingeniero de IA de nivel básico?

¿Por qué se utilizan imágenes en escala de grises para el análisis de componentes principales?