Absolutamente no. Si observa las soluciones ganadoras en las competiciones de Kaggle, encontrará que la técnica más citada es en realidad árboles de decisión impulsados por gradiente (es decir, GBM o XGBoost). Aunque en la práctica se usa típicamente un modelo de conjunto que consta de múltiples algoritmos.
Sin embargo, para las competencias de Kaggle en el dominio de la visión por computadora, los algoritmos de aprendizaje profundo, como las redes neuronales convolucionales, parecen vencer constantemente a otros algoritmos.
Entonces, ¿qué está pasando aquí? Bueno, según el CEO de Kaggle, Anthony Goldbloom, el aprendizaje profundo tiende a funcionar bien en conjuntos de datos no estructurados, preferiblemente grandes. Las imágenes de computadora, el sonido, el texto de forma libre, etc. tienden a caer en la categoría de datos no estructurados. Pero para los conjuntos de datos estructurados, donde las características se pueden etiquetar y enumerar, las técnicas de modelado tradicionales (por ejemplo, árboles de decisión potenciados por gradiente) junto con una buena ingeniería de características tienden a ganar concursos.
- ¿Dónde puedo encontrar un entrenador de programación personal que me enseñe programación y algoritmos?
- Cómo resolver este problema de matriz (detalles en la descripción)
- ¿Qué es un algoritmo para el reemplazo de página (memoria virtual) LRU y FIFO?
- ¿Cuáles son los beneficios de usar la recursividad de la cola? ¿Es siempre posible?
- ¿Hay algún modelo físico o fenómeno que permita resolver rápidamente los problemas NP-hard?
Ahora estoy seguro de que hay ciertos conjuntos de datos estructurados donde un algoritmo de aprendizaje profundo podría vencer a todas las demás técnicas. Por supuesto, también hay algunos conjuntos de datos estructurados donde el bosque aleatorio es el mejor modelo, algunos donde la regresión logística es el mejor modelo, algunos donde las máquinas de vectores de soporte es el mejor modelo, etc. Por lo tanto, para los datos estructurados, los métodos de aprendizaje profundo no “gobernarán” sobre “otros algoritmos como lo hace en datos no estructurados”.