Los diferentes tipos de modelos de aprendizaje sirven diferentes tipos de tareas. Una red profunda puede capturar cosas como imágenes, audio y posiblemente texto bastante bien modelando la localidad temporal espacial. Si bien los modelos basados en árboles (en los que XGBoost es bueno) resuelven muy bien los datos tabulares y tienen ciertas propiedades que una red profunda no tiene (por ejemplo, es más fácil de interpretar e invariante a escala de entrada, mucho más fácil de ajustar).
Ambos métodos son importantes y se usan ampliamente tanto en los desafíos de la ciencia de datos como en la industria. Por ejemplo, el impulso de árboles se usa en todas partes en casi todas las empresas que utilizan el aprendizaje automático y ya tuvieron un gran impacto (ver también los casos de uso incompletos de xgboost dmlc / xgboost).
Como investigador de aprendizaje automático que trabaja en ambos tipos de modelos. Tiendo a creer que necesitamos una comprensión integral de cada tipo y elegir el adecuado para su tarea. XGBoost, redes profundas y otros métodos de uso frecuente (por ejemplo, factorización y regresión logística) merecen la atención de todos los profesionales de aprendizaje automático. No hay una bala de plata para todos los problemas.
- ¿Es posible realizar el aprendizaje en conjunto mediante el apilamiento si solo tengo dos modelos?
- ¿Cuál es la diferencia entre el paralelismo del modelo y el paralelismo de datos?
- ¿Por qué los investigadores de sistemas informáticos no creen en la IA o la aplican a problemas en los 'sistemas informáticos'?
- Si las redes neuronales son opacas y poco entendidas, ¿cómo pueden los ingenieros mejorar aún más el modelo de aprendizaje automático?
- ¿Existe algún audiolibro 'técnico' realmente bueno para la investigación de operaciones o el aprendizaje automático, aparte del algoritmo maestro?