Cómo diseñar un currículo para enseñarme estadísticas

Supongo que un buen currículo de estadísticas no será suficiente para entrenar a alguien para que sea bueno en la construcción de modelos efectivos para datos del mundo real. Necesitas aprender practicándolo. Sin embargo, algunos cursos clásicos de estadística definitivamente serían útiles para proporcionarle una buena base y conocimientos básicos sobre el modelado estadístico.

Encontré este árbol genealógico de los Cursos de Estadística de Posgrado de Harvard
Una buena manera de organizar los cursos relevantes que un estudiante de maestría puede tomar para establecer una base sólida en estadística. No es una ruta paso a paso, sino una hoja de ruta de clúster por clúster.

Puede comenzar construyendo bases teóricas y aplicadas eligiendo cursos de los dos grupos principales. Yo recomendaría tomar los seis cursos, o al menos leer todos los libros relevantes sobre estos temas. No es difícil mapear los libros de la lista que Justin Rising proporcionó en ¿Cuáles son algunos buenos cursos y libros en línea disponibles para aprender probabilidad y estadísticas? a estos cursos. Por ejemplo, la inferencia estadística (Casella & Berger) es un libro de texto ideal para aprender sobre inferencia, y puede estudiar modelos lineales generalizados con modelos generalizados, lineales y mixtos (McCulloch, Searle y Neuhaus).

Después de establecer una base adecuada, puede continuar recogiendo algunos cursos de computación y diseño de experimentos, como lo muestra el árbol, como la computación estadística y el aprendizaje automático estadístico, utilizando el Elemento de aprendizaje estadístico como referencia.

Como dijiste que estás principalmente interesado en modelar deportes y algunos mercados especializados, quizás puedas pasar más tiempo aprendiendo series de tiempo y obtener más conocimiento de dominio también. En este artículo, Preparándose para una carrera como estadístico deportivo: dos entrevistas con personas en el campo, un experto estadístico deportivo ofreció sus ideas sobre qué habilidades y entrenamiento académico (por ejemplo, cursos universitarios) son valiosos para su campo.

Dicho esto, sigo sintiendo firmemente que un buen plan de estudios no es lo suficientemente bueno como para capacitarlo para modelar efectivamente datos del mundo real. Incluso si puede haber varios proyectos analíticos como trabajo de curso, los datos involucrados en estos proyectos a menudo son prefiltrados, limpios y bien estructurados, garantizando que contengan señales. Los datos del mundo real tienden a ser mucho menos agradables.

Aquí hay algunos recursos para comenzar:

  • Proyecto OpenIntro, incluido su excelente OpenIntro Textbook (2nd. Ed);
  • Recurso computacional de estadísticas en línea, incluidos los materiales educativos SOCR (de los cuales, preste atención a los libros SOCR – Socr y Probability y las estadísticas EBook – Curriculum);
  • El Máster de Ciencias de Datos de Código Abierto (Currículum);
  • Currículos de estadísticas de sus instituciones educativas favoritas.

Yo solo comenzaría con esto
Estadísticas 110: Probabilidad
enseñó en Harvard. Lo seguiría con este trabajo
Página de inicio del libro, “Análisis de datos bayesianos”
Sería muy injusto diseñar un plan de estudios ya que nunca he tomado uno, pero basado en este http://www.stat.columbia.edu/~ge
Aquí está mi sugerencia (espero que otros puedan contribuir a esto también)

1) Un capítulo básico sobre probabilidad e inferencia.
2) Modelos individuales y multiparamétricos
3) Modelos jerárquicos / modelos de regresión
4) Comprobación del modelo
5) métodos MCMC

Estoy seguro de que puede ver que esto está bastante sesgado, pero espero que otros puedan ponerlo si necesita cubrir otros conceptos.

En cuanto a libros y otros materiales:
– estadísticas clásicas: cualquier curso de estadística 101 (Probabilidad y estadística o Has buscado estadísticas – Academic Earth)
– análisis bayesiano: cálculo bayesiano con R o haciendo análisis de datos bayesianos

Recomiendo encarecidamente R:
Tutoriales en línea de R y cursos de ciencia de datos – DataCamp
o Coursera (u otros: R – Libros)

El orden (al hacer ejercicios en R, spss, sas, excell, …):
– actualizar algunas matemáticas básicas
– familiarizarse con la teoría de la probabilidad
– aprender sobre estadística clásica: prueba de hipótesis
– aprender anova, regresión y terminar entendiendo el modelo lineal general
– Aprender el análisis factorial y otros métodos multivariados.
– Recoja el análisis bayesiano para comprender que en realidad es mejor que todas las cosas anteriores que acaba de aprender.
– obtener información sobre minería de datos
– Obtenga información sobre el aprendizaje automático.
Creo que a este nivel, deberías estar a la par con una maestría.

No existe un plan de estudios único para un maestro de estadísticas, ya que depende en gran medida de sus intereses.

Mi primer pensamiento es que si quieres convertirte en un estadístico de nivel M, deberías obtener un título de maestría tal vez a distancia.

Si quiere hacerlo usted mismo, la Royal Statistical Society tiene un programa que puede aprender con listas de lectura que lo llevarán a ese nivel. Sin embargo, es mucho trabajo; los maestros deben tener aproximadamente 1200 horas de estudio más una disertación.

Información clave (para exámenes RSS)

More Interesting

¿Cuál es la diferencia entre procesamiento de datos y análisis de datos?

¿Sería difícil hacer una aplicación que tome fotos de partituras y las reproduzca en el instrumento elegido?

Al ejecutar una prueba A / B, ¿durante cuánto tiempo ejecuta el experimento?

Academia VS Industry, ¿qué entorno es más adecuado para adquirir habilidades en "ciencia de datos" (por ejemplo, limpieza de datos, minería / análisis, visualización)?

¿Cuál de los siguientes cursos debería elegir, big data y Hadoop o data science? ¿Cuál de los cursos anteriores tiene más alcance en el futuro? Tengo 1,5 años de experiencia como desarrollador de Java.

¿Qué debo hacer para construir una carrera en ciencia de datos? Soy estudiante de ingeniería química en India y quiero seguir una carrera en ciencia de datos.

¿Por qué todos van a la analítica de negocios / ciencia de datos? ¿Recomendarías esta carrera?

¿Qué es un data mart?

¿Qué opciones de carrera hay para graduados no informáticos en Data Science?

¿Cuáles son las carreras alternativas para una persona que es buena en análisis / algoritmos / estadísticas pero que no es buena en programación como se requiere para un científico de datos?

¿Cuál es el procedimiento de minería de datos?

Aprendizaje automático: ¿cómo puedo obtener eventos y acontecimientos en la vida de las personas a partir de sus estados en Facebook o tweets?

¿Estar basado en datos es un rasgo fundamental de la personalidad, o puede adquirirse como una habilidad?

¿Qué tan popular es Datatau?

Cómo aprender a ser un análisis de datos