¿Son útiles las estadísticas bayesianas en la ciencia de datos?

Útil para Kaggle y útil para la vida real no son sinónimos, como señala Justin Veenstra.

Sin embargo, los enfoques bayesianos han sido de hecho esenciales para ganar las soluciones de Kaggle. Uno de los concursos más desafiantes y de más alto perfil fue el concurso Observando mundos oscuros, donde los concursantes fueron desafiados a detectar la materia oscura que flotaba en el universo: 1er lugar: Observando mundos oscuros

Si está interesado en un tratamiento muy práctico y aplicado de los métodos bayesianos, le recomiendo la Programación Probabilística de Cameron-Davidson y los Métodos Bayesianos para Hackers : Métodos Bayesianos para Hackers

El Capítulo 5 del libro de Pilon contiene una solución completa en Python para el concurso Kaggle de Dark Worlds antes mencionado: http://nbviewer.jupyter.org/gith…

Para los problemas de predicción, donde estamos interesados ​​principalmente en la precisión predictiva (como un concurso de Kaggle), los enfoques bayesianos realmente brillan cuando tenemos una cantidad limitada de datos a nuestra disposición. Los datos pequeños son de alguna manera más resistentes que los datos grandes; ser capaz de incorporar priors se vuelve muy útil con una pequeña N!

Espere. ¿Estamos hablando de Kaggle, o la vida real?

Kaggle es divertido. Kaggle es práctica. Kaggle puede incluso conseguirte un trabajo.

Pero Kaggle no es la vida real. O al menos no suele consistir en el tipo de problema que uno resolvería en el trabajo de la vida real en la ciencia de datos.

Dependiendo del tipo de problemas que resuelva y de lo que tenga que resolver, las estadísticas bayesianas pueden ser muy útiles en la vida real.

Por favor, eche un vistazo a mis respuestas que se encuentran en estos enlaces de QUORA

¿Bayesian Nonparametrics tiene futuro en el campo del aprendizaje automático?

¿Cómo difiere el concepto de probabilidad en las estadísticas bayesianas de su contraparte frecuente?

Las estadísticas bayesianas son fundamentales para la ciencia de datos. Esto es un poco como preguntar si un martillo y una sierra son útiles en carpintería. Hay muchos seguidores de la “teoría de la frecuencia” que no admitirán (o se negarán a reconocer) que su teoría es un subconjunto de la teoría bayesiana.

More Interesting

¿Tendrá Gmail que finalizar su límite de almacenamiento que aumenta automáticamente?

Cómo desarrollar la intuición de datos

¿De qué manera un maestro en estadística de la Universidad de Delhi consigue un puesto de científico de datos de nivel de entrada en las principales empresas?

¿Cuáles son los conceptos clave en la clasificación de datos?

Python (lenguaje de programación): ¿Qué se puede hacer con Python y simplemente no se puede hacer con R en el dominio de la ciencia de datos?

¿Qué clases debo tomar en Oxford para convertirme en científico de datos?

¿Qué es una certificación para un analista de big data?

¿Hay algún curso de análisis (en el Reino Unido o en línea) que se especialice en interpretar análisis y datos para darme información comercial significativa?

¿Existe una forma más eficiente de almacenar tablas y filas sin tener que repetir ID?

¿Qué es mejor estudiar, ciencia de datos o big data?

¿Alguien podría hablarme sobre las universidades para el análisis de datos o la ciencia de datos en Europa o EE. UU. (Tiempo completo -2 años)?

¿Un MBA en operación / cadena de suministro ayudará a comenzar una carrera en ciencias analíticas y de datos?

¿Cuál es la configuración recomendada para una aplicación de Big Data?

¿Puedo usar el algoritmo de aumento de gradiente para datos con tiempo (año) y latitudes y longitudes como predictores?

Deep Learning se implementa principalmente en big data. ¿Qué piensa sobre usarlo en datos con muestras limitadas pero de altas dimensiones como fMRI?