¿Cómo se usan los conceptos de probabilidad y estadística en la ciencia de datos?

La ciencia de datos implicaba, entre otras cosas, la minería de datos y el aprendizaje automático.

La minería de datos implica la extracción de datos útiles de un mar de datos (relevantes e irrelevantes). Los modelos estadísticos (que implican conceptos de probabilidad como Entropía y distribuciones condicionales) se utilizan para realizar dicha extracción.

Por ejemplo, existen modelos para resolver problemas específicos como clasificación, agrupamiento, predicción, etc. En la clasificación , desea clasificar un conjunto particular de observaciones en particular para un grupo específico. Una de las formas de hacerlo puede ser usar un modelo de regresión logística .

Ese es un ejemplo. Hay muchos ejemplos de este tipo.

En general, la razón por la que las estadísticas y la probabilidad son tan importantes es que el campo de las estadísticas proporciona muchas herramientas para comprender los datos subyacentes, extraer inferencias de los datos, hacer predicciones, etc.

Las estadísticas le ayudan a transformar datos sin sentido en información útil. Entonces, diría que los conceptos de estadística y probabilidad no solo se UTILIZAN en Data Science, son la BASE completa de Data Science.

Para una mirada más detallada, consulte estos enlaces: Minería de datos y estadísticas: ¿Qué es la conexión?

Esta es la diferencia entre estadística y ciencia de datos.

Ciencia de datosEstadísticaProbabilidad

Related Content

¿Cuál es el mejor instituto de big data en Kolkata?

¿Qué técnicas analíticas de datos debo aprender para el comercio minorista?

¿Cuáles son las oportunidades interesantes en la industria farmacéutica para emprendedores con experiencia en negocios, economía y ciencia de datos?

¿Cuál es la diferencia entre trabajar en análisis y ciencia de datos?

Cómo mejorar mi capacidad para resolver problemas de probabilidad

¿Qué es la ciencia de datos? ¿Cuál es el alcance? ¿El análisis de datos y el análisis comercial son lo mismo? ¿Necesitamos estudiar programación?

¿Hay alguna manera de comprimir una gran cantidad de datos a un tamaño muy pequeño como en una bomba zip?

La respuesta es muy larga y compleja, por lo que la respuesta es corta: se usa para determinar la tendencia de los datos, principalmente utilizando distribuciones de probabilidad y modelos de regresión.

Samrat Sanyal

More Interesting

Entrevistas de trabajo de análisis de datos: ¿qué puede decir sobre SQL como herramienta para mostrar sus habilidades?

¿Eres un científico de datos pero tu especialidad no era CS? En caso afirmativo, ¿cómo hizo la transición? ¿Y cuánto te llevó?

¿Cuántos conocimientos estadísticos y de probabilidad se requieren para aprender ciencia de datos?

¿Qué es el marco de Big Data?

¿Tiene 36 años para emprender una carrera en ciencia de datos?

¿Cómo ayuda el análisis de datos a los programadores informáticos?

¿Cómo se puede determinar si un conjunto de datos es grande o pequeño?

¿Cómo se puede pasar de la función de consultor de un MBB a la función de ciencias de datos?

¿Cuál es la mejor arquitectura de chispa (big data) crees que para este caso de uso?

Cómo usar datos de encuestas para modelar dinámicas de sistemas

¿Cuáles son los mitos del big data que afectan a las PYME?

¿Cuáles son hermosos ejemplos / aplicaciones de distribuciones de probabilidad complejas en la vida real?

¿Qué tan difícil es para un chico experimentado de 5 años cambiar a la carrera de ciencia de datos en India?

¿Cuál es el mejor instituto de capacitación en Pune para ciencia de datos y cursos de big data?

Cómo comenzar a analizar datos usando R

Web Analytics