¿Qué temas de estadística debo aprender antes de aprender ciencia de datos si soy de un entorno no estadístico?

Gracias por el A2A. Debe consultar las respuestas publicadas para esta pregunta: ¿Cómo aprendo estadísticas para la ciencia de datos? ¿Qué libro de estadística le recomienda a un aspirante a científico de datos que esté familiarizado con las estadísticas básicas y las matemáticas? Creo que las respuestas son buenas y hacen justicia a la pregunta.

Mis dos centavos: comience con la probabilidad y las estadísticas de la escuela secundaria. Ese es definitivamente el punto de partida. Aprende un poco de cálculo si aún no lo has hecho. Esa es una necesidad para el tipo de análisis estadístico que exige la ciencia de datos. Proceda a aprender sobre probabilidad condicional, teorema de Bayes, variables aleatorias y distribuciones. Esto debería sentar las bases suficientes.

También recomiendo obtener un buen libro de referencia. Hay dos libros que se usan ampliamente (obtenga uno de ellos):

1. Sheldon Ross – “Introducción a la probabilidad y las estadísticas para ingenieros y científicos”

2. Morris DeGroot – “Probabilidad y estadísticas”

Ambos son excelentes, pero suponen que el lector es experto en cálculo.

“Dame 6 horas para cortar un árbol y pasaré las primeras cuatro afilando mi hacha”

-Abraham Lincoln

Me suscribo a esta cita e intento aplicarla. Creo firmemente en hacer las cosas bien en lugar de hacerlo rápido. Si está muy seguro de aprender ciencia de datos, le sugiero que no mida las cosas a tiempo. Necesitas mucha paciencia para aprender ciencia.

Si ha decidido aprender ciencia de datos, primero le recomendaré formar una base sólida en programación y estadísticas. Estos temas son la base de la ciencia de datos.

Cuando dices que vienes de un entorno no estadístico, supongo que aún tienes el conocimiento básico de estadística que te han enseñado en tu universidad. Aparte de eso, lo que le recomendaría que aprenda son los siguientes temas:

  • Variables aleatorias
  • Distribuciones estadísticas
  • Teoría de probabilidad (Cálculo de MGF, CGF, media, mediana, modo, varianza Máxima probabilidad de expectativa, teoremas de límite central, ANOVA)
  • Montaje de una distribución.
  • Muestreo
  • Prueba de una hipótesis.
  • Modelado Bayesiano
  • Regresión y series de tiempo

Descargo de responsabilidad: soy cofundador de @GreyAtom y ayudo a talentos de ingeniería a encontrar carreras sostenibles en tecnologías emergentes.

El programa insignia altamente selectivo de GreyAtom tiene como objetivo orientar a los profesionales que trabajan y los más novedosos en el inicio de su carrera de ciencia de datos. Los estudiantes crearon proyectos a partir de conjuntos de datos REALES y declaraciones de problemas proporcionadas por nuestra industria y socios de contratación. El programa se basa en el aula y se basa en la práctica. GreyAtom es un ecosistema donde los estudiantes pueden aprovechar lo mejor de la academia, profesionales de la industria y personas influyentes.

Algunos enlaces rápidos

Chatee con un consejero académico: le invitamos a compartir todas sus dudas e inseguridades, a las que haremos todo lo posible para guiarlo hacia su camino profesional hacia el éxito. https://calendly.com/greyatom/co

El aprendizaje de estadísticas es un elemento muy crucial de la ciencia de datos. Los temas de estadística inferencial y descriptiva son especialmente importantes. Por favor, revísalos a fondo. Además, busque temas como probabilidad, matrices, cálculo.