La estadística es una parte crucial de la ciencia de datos. Si piensa en las 3 fases de un proyecto típico de ciencia de datos, recopilación de datos, análisis de datos y comunicación de resultados, las estadísticas son críticas en las dos primeras. Debe aplicar técnicas de muestreo adecuadas para que los datos recopilados no estén sesgados. En la Fase II, necesita habilidades de modelado para obtener información profunda sobre los datos si la pregunta de negocios tiene que ser respondida a través del modelado. La visualización se produce antes del modelado como parte del análisis exploratorio de datos. Arroja luz sobre tendencias, patrones y, a menudo, implica hallazgos. La visualización siempre es necesaria en un proyecto de ciencia de datos. El peso de las estadísticas aumenta proporcionalmente al grado de complejidad del proyecto.
La programación y la comunicación son habilidades imprescindibles para cualquier proyecto de ciencia de datos.
¿Qué papel juegan las estadísticas en la ciencia de datos en comparación con habilidades como programación o visualización y comunicación?
Related Content
¿En qué se diferencia un MS en Business Analytics de un MS en Data Science?
¿Cuál es el mejor instituto de investigación para la ciencia de datos en India?
¿Qué tan efectivos son los cursos en línea para aprender ciencia de datos?
¿Qué deben saber todos sobre la ciencia de datos?
¿Qué tan difícil para un principiante de programación aprender tecnologías de ingeniería de datos?
Si estás hablando de estadísticas de big data / aprendizaje automático, supera la programación. Cuando tienes grandes cantidades de datos, tienes que usar análisis estadísticos, la fuerza bruta pura no va a cortarlos.
No existe un límite claro, todo depende de lo que esté haciendo, pero generalmente es más inteligente usar estadísticas cuando tiene muchos elementos para analizar.
La visualización es ciertamente buena, pero cuando sus datos varían mucho, o cuando varía muy poco, puede que no sea muy útil. Es difícil notar un 1% en un gráfico, a menos que trace cantidades y límites muy específicos.
De la misma manera, visualizar un cambio del 90% puede o no ayudar, todo depende de la precisión que necesite, así como del resultado que está buscando.
La visualización, las estadísticas y la programación son solo medios para un fin.
Sin estadísticas, no creo que se pueda hacer nada en el campo de big data / data science porque la programación se realiza en muchos otros campos, pero en mi opinión, las estadísticas son el corazón de big data / data science.
Un aún más grande.
More Interesting
¿Cómo es trabajar con DJ Patil?
¿Qué tipo de libertades tengo con los datos de Kaggle?
¿Cómo se pasa de ser un graduado en informática a un eventual científico de datos?
¿Cómo es una entrevista de científico de datos en Yelp?
Cuando observamos el muestreo, ¿por qué necesitamos 30 datos?
¿Qué tipo de proyectos paralelos de ciencia de datos se sugieren para un estudiante de pregrado?
¿Cómo se aplica el big data al marketing de películas?
¿Qué compañía está haciendo el mejor producto de prevención de pérdida de datos en 2015?