OMI sí, hasta cierto punto. Big data implica métodos analíticos que requieren más habilidades de programación en lugar de las viejas y buenas “estadísticas de tamaño de muestra bajo y mediano”. Big Data también lucha contra diferentes enemigos: problemas de memoria y velocidad de cómputo en algoritmos en tiempo real en lugar de pruebas de poca potencia, supuestos violados, valores atípicos, diseños desequilibrados (¿y qué suma de cuadrados deberías usar en este caso en particular?) muestra…
La inferencia estadística clásica no tiene sentido en millones de registros. Modelado, por supuesto, pero dado que no hay inferencia, no hay problemas con supuestos, correcciones (por ejemplo, error tipo I), hipótesis a priori, análisis de potencia, etc. Se vuelve más y más descriptivo a medida que te acercas más y más a la población. OK, con una excepción: pronosticar la serie temporal.
Pero las cosas no se ponen tan mal porque:
- ¿Cuál es una excelente manera de aprender a usar las funciones en paquetes como Ggplot2 y Pandas en R y Python?
- ¿Cuáles son las técnicas más modernas de minería de datos / aprendizaje automático sobre datos inmobiliarios?
- ¿Por qué están tan de moda los modelos de caja negra?
- ¿Cómo reconocer a Rising Stars en el campo de los negocios? Que métodos
- Tengo un dato de 50 filas de Lakh. ¿Cómo lo abro en R o Python? ¿O hay alguna otra alternativa que no sea usar Hadoop?
- la ciencia de datos no se trata solo de explorar grandes conjuntos de datos y crear tablas dinámicas para su gerente 🙂 La econometría y el pronóstico, por ejemplo, aún requieren habilidades estadísticas, por lo que puede capacitarse en los problemas típicos de modelado. La intuición de su estadístico será útil allí.
- Todavía hay áreas en las que los “datos pequeños” son la realidad cotidiana, por ejemplo, la evaluación de la calidad en el desarrollo de medicamentos o la medicina basada en la evidencia, incluida la investigación clínica. 200 sujetos? ¡Eres afortunado! Su vida es tan fácil en comparación con la mía con 40 observaciones y una pila completa de análisis solicitados … 🙂
- para jugar con seguridad con big data, algunos antecedentes estadísticos siguen siendo útiles. Alguien tiene que enseñarle a los analistas de big data los conceptos básicos. Quizás no sea el teorema de Radon-Nikodym, pero aún así … 🙂