Por un lado, los conjuntos de datos con los que trabaja la academia son:
a) muy limpio. Por ejemplo, los académicos consideran que el conjunto de datos de autos UIUC está resuelto. Los autos en esos conjuntos de datos tienden a ser autos cuadrados de los años 80 que son fáciles de detectar y localizar. También son completamente frontales o posteriores o laterales.
Trabajé en el auto sin conductor y puedo decir que en el mundo real los autos se ven como: motos, camiones grandes, vehículos negros en la sombra, manchas apenas visibles al anochecer, medio ocluidas, en todos los ángulos de giro posibles. Los autos modernos también tienen un aspecto más liso y ovoide y no se parecen a los autos cuadrados en el conjunto de datos de UIUC.
De hecho, a veces las señales de tráfico se parecen más a los autos cuadrados que a los autos reales.
b) demasiado pequeño. He trabajado en problemas similares al conjunto de datos de 80 millones de imágenes pequeñas. Pero los conjuntos de datos del mundo real son mucho más grandes que 80 millones. Por muchos ceros. Y las imágenes no son pequeñas.
- ¿Cuál crees que es la razón detrás de la asociación de Microsoft y Amazon en la tecnología de red neuronal llamada 'Gluon'?
- ¿Cómo puede alguien usar el verano para hacer un gran progreso en su conocimiento en los campos de redes neuronales artificiales y aprendizaje profundo?
- ¿Cuál es el significado físico de usar SVD / NMF en una matriz de correlación espacial?
- ¿Cuán sensible es el análisis de componentes independientes (ICA) a la simultaneidad de la señal de entrada?
- ¿Qué tan rápido es Theano en comparación con otras implementaciones de DBN? ¿Cómo se compara con otras implementaciones de GPU (potencialmente no públicas) para la velocidad de entrenamiento en grandes conjuntos de datos?
c) sin metadatos. En la industria, muchos corpus vienen con grandes cantidades de metadatos. Por ejemplo, las imágenes pueden tener texto cerca de ellas. Por lo tanto, sería demasiado simplista usar solo señales de contenido de imagen por sí mismas. Los conjuntos de datos académicos tienden a ser de un ‘canal de señal’ a la vez para diversas especialidades. por ejemplo, un conjunto de datos de visión y un conjunto de datos de PNL, pero rara vez ambos al mismo tiempo.