Útil para Kaggle y útil para la vida real no son sinónimos, como señala Justin Veenstra.
Sin embargo, los enfoques bayesianos han sido de hecho esenciales para ganar las soluciones de Kaggle. Uno de los concursos más desafiantes y de más alto perfil fue el concurso Observando mundos oscuros, donde los concursantes fueron desafiados a detectar la materia oscura que flotaba en el universo: 1er lugar: Observando mundos oscuros
Si está interesado en un tratamiento muy práctico y aplicado de los métodos bayesianos, le recomiendo la Programación Probabilística de Cameron-Davidson y los Métodos Bayesianos para Hackers : Métodos Bayesianos para Hackers
- ¿Por qué tantos anuncios de trabajo para Big Data requieren habilidades de Excel?
- ¿Qué puede hacer Java por un científico de datos que Python / R no puede?
- ¿Alguien puede ayudarme a estudiar conferencias de análisis de Jigsaw Academy?
- ¿Cuál es la diferencia entre una maestría en análisis de negocios y big data y una maestría en ciencia de datos? ¿Qué habilidades necesitas dominar para cada uno?
- ¿Existe algún beneficio de saber que Java debe seguir el camino de ser un científico de datos o puede tomarse como un complemento? (Java-as Map reduce los requisitos previos: análisis de Big Data)
El Capítulo 5 del libro de Pilon contiene una solución completa en Python para el concurso Kaggle de Dark Worlds antes mencionado: http://nbviewer.jupyter.org/gith…
Para los problemas de predicción, donde estamos interesados principalmente en la precisión predictiva (como un concurso de Kaggle), los enfoques bayesianos realmente brillan cuando tenemos una cantidad limitada de datos a nuestra disposición. Los datos pequeños son de alguna manera más resistentes que los datos grandes; ser capaz de incorporar priors se vuelve muy útil con una pequeña N!