¿Qué necesito saber para convertirme en científico de datos?

Si desea destacar, amplíe su lente más allá de los algoritmos. La mayoría de los científicos de datos hoy en día comienzan a aprender cómo programar clasificadores, regresiones y aprendizaje profundo utilizando R o Python, y listo nace un científico de datos. En realidad, el análisis es una pequeña parte del proceso de transformación de datos en un valor real accionable.

Una vez que esté cómodo con los algoritmos, aprenda sobre el resto de la cadena de valor de datos. Aprenda la ingesta de datos de múltiples fuentes, cómo almacenar y almacenar datos de manera efectiva utilizando herramientas ETL, transmisión y bases de datos: este conocimiento de la ingeniería de datos lo ayudará a ser más efectivo en la configuración de datos para responder a los problemas que sus algos resolverán. El último tramo es el desarrollo de aplicaciones: aprenda a empaquetar su algoritmo en una aplicación o informe productivo que ayudará a los usuarios no técnicos a interactuar y comprender su trabajo. Esto puede ser un simple d3.js o R-shiny visual visualizado a una aplicación web completa.

Los algoritmos son poderosos, pero expandir su conocimiento más allá de la parte analítica lo hará más útil para los demás.

Dejando a un lado los procesos de datos, el conocimiento más útil es algo que aprende con el tiempo: experiencia de dominio con varias empresas o problemas científicos.

En los negocios, algunas áreas funcionales comunes para análisis avanzados están en marketing, finanzas, gestión de riesgos, operaciones y redes. También hay matices entre industrias como la banca, las telecomunicaciones, los medios, el comercio minorista, la manufactura y la energía. Si usted es más investigador académico, la mayoría de los campos científicos tienen problemas de grandes datos que resolver, como la astrofísica, la biología e incluso la psicología, donde se ramifica en investigación de mercado y política. Encuentre un área que le parezca interesante y vea dónde puede utilizar su conocimiento de datos.

Los algoritmos, herramientas y plataformas son más útiles si la persona que los maneja tiene experiencia práctica usándolos para resolver problemas reales.

Para aprender y sobresalir en Data Science, debe tener una comprensión adecuada de los conceptos estadísticos y una sólida base cuantitativa y conocimiento de cualquiera de los lenguajes de programación como java, perl, Python o R. Además, necesita experiencia en SQL.

Si desea ser un científico de datos, envíeme un correo electrónico para obtener más información en [correo electrónico protegido]

Necesitas saber lo siguiente:

1 – Estadísticas

2 – Lenguaje de programación (R o Python)

3 – Manipulaciones de datos (almacenamiento / ingeniería / limpieza / ETL / exploración)

4 – Pruebas A / B

Puedes aprenderlos todos fácilmente en Udacity, tienen excelentes cursos gratis.