¿Cuánto conocimiento estadístico es necesario para convertirse en un buen científico de datos? ¿Alguna guía / fuente / libro práctico para aprender estadísticas que sea suficiente para fines de ciencia de datos?

Todavía no soy un científico de datos, pero estoy estudiando psicología. El tema principal de los métodos de psicología es la estadística. Entonces tienes suficiente. Después de cuatro semestres de psicología, tuve una introducción a Java como un tema menor. Un semestre después (ahora) estoy siguiendo el curso de Andrew Ng sobre aprendizaje automático, mientras asistía a una conferencia sobre minería de datos en mi universidad, en la que la mayoría de los otros estudiantes son estudiantes de informática empresarial. Lo que puedo decir hasta ahora es que una buena base en estadística definitivamente ayuda a entrar en la ciencia de datos. Viniendo de Psicología, definitivamente todavía tengo una falta de conocimiento y comprensión sobre las estructuras de datos y la implementación de métodos de minería de datos en código auto escrito. Pero cuando miro a las personas de informática empresarial, claramente carecen de metodología cuando se trata de estadísticas.
Están utilizando herramientas como rapidminer, lo cual es definitivamente genial, pero la mayoría de las veces examinan los datos simplemente observando tramas y gráficos, y están retocando hasta que encuentran algo significativo, mientras que, por ejemplo, descuidan por completo el aumento de la inflación del error alfa. con cada prueba u operación realizada en los datos …
Para abreviar, estoy de acuerdo en que depende del dominio en el que intente aplicar su capacidad para analizar datos. Cuanto más científico, más sólido debería ser su conocimiento de métodos, para los compañeros de trabajo y los empleadores en un contexto científico es muy probable que se usen con buenos estándares cuando se trata de métodos. Si solo tiene en mente un pequeño inicio, probablemente no sea necesario contar con estadísticas masivas desde el principio, pero también mejoraría profundamente su curva de aprendizaje en ciencia de datos. Si prefiere ahorrar el tiempo necesario para aprender estadísticas para otra cosa, eso podría no ser un gran problema en un contexto económico. A juzgar por qué tipo de estadística se enseña en economía en mi universidad y comparar eso con las estadísticas en psicología, eso generalmente nos hace reír. Y eso a pesar del hecho de que se considera una de las mejores universidades alemanas para la economía.
Aparte de eso, si su pregunta solo tiene como objetivo adivinar si puede seguir un curso de ciencia de datos para principiantes, creo que lo más probable es que enseñen los conceptos básicos necesarios de estadística sobre la marcha.
Con respecto a los libros, todo lo de Andy Fields es muy recomendable, aunque sus libros generalmente se basan en la enseñanza de algún software de estadísticas como R o SPSS, explica muchas estadísticas a lo largo de esos libros de una manera muy comprensible. Y hasta donde recuerdo, hay un video de clase de estadísticas de Harvard en línea, que escuché que es muy bueno. Desafortunadamente, todo lo demás que puedo recomendar está disponible solo en alemán 😉

Respuesta escrita precisa para su pregunta: la estadística es una habilidad básica para el científico de datos
¡Echar un vistazo! De hecho, encuentre preguntas más similares o pregunte a los profesionales de forma gratuita. Siempre han ayudado a personas como yo que desean aprender sobre ciencia de datos.

¡Espero que esto ayude!

More Interesting

Estoy empezando en Kaggle. Tengo experiencia en aprendizaje automático y modelos gráficos probabilísticos. ¿Cómo puedo mejorar en Kaggle?

Cómo prepararse para una entrevista de ciencia de datos o aprendizaje automático en una gran empresa tecnológica

Python (lenguaje de programación): ¿Qué se puede hacer con Python y simplemente no se puede hacer con R en el dominio de la ciencia de datos?

¿Cómo manejan los científicos de datos las tareas de aprendizaje automático con características correlacionadas?

¿Qué queremos decir cuando usamos la palabra ruido en ciencia de datos y estadística?

¿Hay alguna empresa rentable de minería de datos en la India?

¿Cómo diferenciará el campo de análisis predictivo y ciencia de datos?

¿Cuál es el mejor instituto de capacitación en ciencia de datos?

¿Existen extensiones de PostgreSQL relacionadas con la ciencia de datos?

¿Cuáles son algunas necesidades de análisis de datos insatisfechos o de abastecimiento público relacionadas con el problema del cambio climático?

¿Qué es el software Tally? ¿Cómo ayuda a capturar los datos del canal?

¿Puedo convertirme en un analista de datos sin una calificación en estadística o matemáticas como especialidad?

¿Puedo aprender Big Data después de 6 años?

¿Existe alguna correspondencia (en línea / visitas cortas al campus) del curso de Ciencia de Datos que ofrecen las Universidades en Europa para los Profesionales que trabajan en India?

¿Cómo se mide y evalúa la calidad de los motores de recomendación?