¿Qué papel juegan las estadísticas en la ciencia de datos en comparación con habilidades como programación o visualización y comunicación?

La estadística es una parte crucial de la ciencia de datos. Si piensa en las 3 fases de un proyecto típico de ciencia de datos, recopilación de datos, análisis de datos y comunicación de resultados, las estadísticas son críticas en las dos primeras. Debe aplicar técnicas de muestreo adecuadas para que los datos recopilados no estén sesgados. En la Fase II, necesita habilidades de modelado para obtener información profunda sobre los datos si la pregunta de negocios tiene que ser respondida a través del modelado. La visualización se produce antes del modelado como parte del análisis exploratorio de datos. Arroja luz sobre tendencias, patrones y, a menudo, implica hallazgos. La visualización siempre es necesaria en un proyecto de ciencia de datos. El peso de las estadísticas aumenta proporcionalmente al grado de complejidad del proyecto.
La programación y la comunicación son habilidades imprescindibles para cualquier proyecto de ciencia de datos.

Si estás hablando de estadísticas de big data / aprendizaje automático, supera la programación. Cuando tienes grandes cantidades de datos, tienes que usar análisis estadísticos, la fuerza bruta pura no va a cortarlos.

No existe un límite claro, todo depende de lo que esté haciendo, pero generalmente es más inteligente usar estadísticas cuando tiene muchos elementos para analizar.

La visualización es ciertamente buena, pero cuando sus datos varían mucho, o cuando varía muy poco, puede que no sea muy útil. Es difícil notar un 1% en un gráfico, a menos que trace cantidades y límites muy específicos.
De la misma manera, visualizar un cambio del 90% puede o no ayudar, todo depende de la precisión que necesite, así como del resultado que está buscando.

La visualización, las estadísticas y la programación son solo medios para un fin.

Sin estadísticas, no creo que se pueda hacer nada en el campo de big data / data science porque la programación se realiza en muchos otros campos, pero en mi opinión, las estadísticas son el corazón de big data / data science.

Un aún más grande.

More Interesting

¿Cómo es trabajar con DJ Patil?

¿Qué tipo de libertades tengo con los datos de Kaggle?

¿Cómo se pasa de ser un graduado en informática a un eventual científico de datos?

¿Puedo convertirme en un buen científico de datos o ingeniero de aprendizaje automático si no tengo experiencia de mercado en el desarrollo de software?

¿Cómo es una entrevista de científico de datos en Yelp?

Cuando observamos el muestreo, ¿por qué necesitamos 30 datos?

¿Cómo convertirse en un científico de datos financieros? Quiero aplicar programación, matemáticas y finanzas en un solo trabajo. Tengo una licenciatura en informática, soy bueno con Java y C ++, y estoy aprendiendo R y Python. ¿Cuál debería ser mi próximo paso?

¿Qué subcampos de aprendizaje automático son los más cercanos a aquellos con experiencia en mecánica de fluidos?

¿Qué es mejor, Data Science M.Tech de IIT Hyderabad o Big Data Analytics Certification de IIM Bangalore?

¿Qué tipo de proyectos paralelos de ciencia de datos se sugieren para un estudiante de pregrado?

¿Cuál es la diferencia entre analista de negocios, analista de datos, científico de datos, analista de inteligencia de negocios, analista de sistemas de negocios y gerente de producto?

¿Por qué usamos big data?

¿Cuál es la progresión profesional típica de un científico de datos, gerente financiero o gerente de programa?

¿Cómo se aplica el big data al marketing de películas?

¿Qué compañía está haciendo el mejor producto de prevención de pérdida de datos en 2015?