¿Cuántos conocimientos estadísticos y de probabilidad se requieren para aprender ciencia de datos?

La respuesta correcta aquí es: depende.

La respuesta segura aquí es: necesitará conocer suficientes estadísticas para describir datos, hacer inferencias y construir modelos simples al menos, para aprender ciencia de datos.

  1. Si está desarrollando software que tiene métodos analíticos y aprendizaje automático integrados, es probable que necesite ser muy exhaustivo en el algoritmo o análisis específico que está integrando. Esto requiere una amplitud específica en un área, ya sea en el desarrollo de prototipos o en el desarrollo de una base de código madura y productiva, en oposición a amplios conjuntos de habilidades.
  2. Si va a realizar un análisis de datos en un entorno empresarial o estratégico, con los resultados del análisis informando algún tipo de actividad continua de toma de decisiones, debe tener suficiente profundidad, pero mucha amplitud. Esto se debe a que es probable que evalúe muchos tipos diferentes de enfoques y métodos de análisis de datos y los evalúe uno al lado del otro. Puede hacer una transición de algunas de estas aplicaciones completas y, en esos casos, es posible que deba proporcionar cierta profundidad al equipo de desarrollo. En general, es probable que requiera más profundidad.

Estas consideraciones deben desempeñar un papel cuando evalúa sus fortalezas y debilidades en relación con un rol o una posición específica que está evaluando.

También me gustaría agregar que existen numerosos MOOC gratuitos que enseñan análisis de datos y estadísticas desde cero a personas con experiencia limitada en estas áreas temáticas. Son un buen punto de partida para aprender ciencia de datos e incluyen temas estadísticos también.

¡Josh Willis resume el verdadero significado de Data Science con 140 caracteres en este hermoso tweet!

Se creía que para hacer ciencia de datos necesitabas dominar la habilidad de las matemáticas y las estadísticas, lo que no representa la imagen completa.

No es necesario tener un doctorado en matemáticas para convertirse en un científico de datos.

Data Science es una mezcla de estadísticas y programación. Ambos son necesarios para comenzar incluso con los conceptos básicos de Data Science. Sin embargo, la buena noticia es que no necesita dominar a ninguno de ellos. Para comenzar, debe tener un conocimiento adecuado de los fundamentos básicos y el resto puede elegirlo a medida que avanza.

Un par de temas que necesitará para comenzar:

  • Teoría de conjuntos, incluidos los diagramas de Venn
  • Propiedades de la recta numérica real ~ Notación de intervalo y álgebra con desigualdades
  • Usos para suma y notación Sigma
  • Matemáticas en el plano cartesiano (x, y), fórmulas de pendiente y distancia
  • Graficar y describir funciones y sus inversas en el plano xy
  • El concepto de tasa de cambio instantánea y líneas tangentes a una curva.
  • Exponentes, logaritmos y la función de registro natural.
  • Teoría de la probabilidad, incluido el teorema de Bayes.

Estos temas están cubiertos en Data Science Math Skills curso en Coursera

Si está buscando un trabajo que requiera aplicaciones de Data Science en varios dominios, esto debería ser suficiente. Si está buscando un poco de investigación en el campo de la ciencia de datos, entonces le gustaría hacer los siguientes cursos, que son un poco más profundos conceptualmente que el curso en Coursera

  • Curso de álgebra lineal del MIT
  • Curso de cálculo multivariable del MIT

Sin embargo, independientemente de ambos, se recomienda hacer los siguientes cursos.

  • Curso de aprendizaje automático de Andrew NG
  • Curso de aprendizaje automático de Abu Mostafa

Espero que esto te ayude 🙂

Las estadísticas son la base de su ciencia de datos. Sin estadísticas, no conoce los métodos para analizar datos, en última instancia, no puede resolver las decisiones comerciales.

TechSamayu ofrece un programa en línea de capacitación en ciencia de datos. Nuestra especialidad es la atención individual y el seguimiento del progreso de los estudiantes. Acomodamos solo a diez personas por lote y se supone que cada persona debe resolver cuestionarios y casos después de cada tema. Solo una vez que todos los estudiantes tengan claro el tema, el entrenador pasará a la siguiente sesión. Acabamos de comenzar la serie de videos de estadísticas y Mire el video reciente para comenzar con las estadísticas requeridas para la ciencia de datos.

Las estadísticas son imprescindibles para las ciencias de datos, Big Data y otras ciencias de datos. En ciencia de datos utilizando conocimiento 100% estadístico. Si analiza algo si ya conoce el conocimiento estadístico.

Se necesitará una cantidad muy detallada de matemáticas para comprender los conceptos de aprendizaje automático y ciencia de datos.

Además de Estadísticas y Probabilidad, se requerirá una cantidad decente de álgebra lineal y cálculo multivariante. Sin embargo, dado que su pregunta es precisamente sobre estadísticas y probabilidad, estos son algunos de los temas que le ayudarán mucho:

1.Probabilidad e inferencia estadística para la ciencia de datos.

2. Modelos estadísticos y computación.

3. Aprendizaje estadístico para la ciencia de datos.

4. Análisis bayesiano.

5. Teoría de la probabilidad.

Espero que esto ayude.

Los científicos de datos extraen datos estructurados y no estructurados y los procesan mediante análisis en el formato adecuado. Para ser un científico de datos, uno necesita tener el pensamiento y las habilidades analíticas adecuadas; de lo contrario, no podrá convertirse en científico de datos. Data Science es una interpretación conceptual para unir estadísticas y analizar datos con los métodos relacionados. La idea original es comprender y emplear técnicas y métodos utilizados por un científico de datos para estructurar los datos para que sean útiles.

More Interesting

¿Qué es la ciencia de datos y el análisis y cómo puede beneficiar a las empresas?

¿Cuál es la diferencia entre el modelo predictivo y una regla comercial descriptiva?

¿Qué tan grandes fueron las primeras computadoras? ¿Por qué eran tan grandes?

¿Puedo ingresar a la ciencia de datos con un GPA bajo?

¿La física ayuda a entender la ciencia de datos?

¿Cuál es la mejor manera de aprender los scripts de shell para la ciencia de datos?

¿Cómo genera LinkedIn exactamente la lista de usuarios que "los espectadores de este perfil también vieron"?

¿Puede un desarrollador de Java entrar en big data y análisis sin ninguna experiencia previa?

Como aspirante a científico de datos, ¿qué lenguaje de programación debo aprender entre Python, R, C # y Java, dado que no tengo experiencia previa en programación? Tengo una licenciatura en economía y estadística y una maestría en administración.

Cómo cambiar de ingeniería de datos a modelos de construcción, aprendizaje automático, etc.

¿En cuántas dimensiones (Vs) se define comúnmente Big Data?

Si necesito aprender ciencia de datos, ¿qué puedo aprender en el primer paso o de la A a la Z?

¿Cuánto de R (o minería de datos) debo aprender para la investigación de mercado y para un negocio personal / propio?

¿Por qué necesitamos científicos de datos si tenemos aprendizaje automático que puede analizar y procesar datos?

¿Cuál es la mejor manera de comenzar una carrera en ciencias de datos después de completar un título en ciencias físicas?