En visión por computadora, sí, el aprendizaje profundo realmente funciona. Esto no es una conspiración de los fabricantes o investigadores de GPU (como un aparte, “es una conspiración” casi nunca es una respuesta).
En el desafío de detección de objetos VOC de PASCAL, que fue un punto de referencia muy bien establecido, bien regulado y extremadamente popular en el que las anotaciones del conjunto de prueba nunca se han publicado, estos son los números (más alto es mejor):
Mejor rendimiento no profundo: 40.9 (con o sin datos adicionales)
Rendimiento básico básico: 62,4
Esa es una mejora del 50%, en un campo donde una mejora del 10% se consideraba digna de publicación.
En el desafío de segmentación PASCAL VOC, que es igualmente bien considerado, el mejor rendimiento no profundo (más alto es mejor): 50.6, el mejor rendimiento profundo: 64.4.
- ¿Qué artículos se consideran los clásicos de lectura obligatoria en informática?
- ¿Cuáles son las áreas fascinantes de la informática? ¿Cuáles son algunas de las áreas más avanzadas técnicamente de la informática?
- ¿Cómo es el Vietnam Journal of Computer Science en términos de reputación, tasa de aceptación y calidad de los documentos aceptados?
- ¿Recomendaría ITU sobre Fast para alguien que quiera publicar en su licenciatura? ¿Qué hay de NUST?
- ¿Cuáles son buenos temas para una tesis de informática?
En Imagenet Classification, nuevamente un desafío donde los datos de la prueba nunca se publicaron, en 2012, que fue el año decisivo, el algoritmo profundo más simple logró casi * la mitad * de la tasa de error del mejor algoritmo no profundo.
Como alguien que recientemente comenzó a trabajar en técnicas de aprendizaje profundo, me complacería disipar cualquier duda que pueda tener.