¿Cuáles son las rutas de aprendizaje típicas del análisis de datos?

La ciencia de datos de K2 ha construido su plan de estudios en la ruta de aprendizaje típica de la ciencia de datos y el análisis de datos. En este momento, hemos recibido información de científicos y analistas de datos líderes en el campo para desarrollar el plan de estudios actual. Eche un vistazo a nuestro sitio web y programa de estudios para obtener más información.

Si está buscando un puesto de analista de datos, la mayoría de los puestos de nivel de entrada no requerirán que usted sepa R. Definitivamente querrán que conozca MS Excel, SQL (u otro lenguaje de base de datos), alguna herramienta de visualización y cómo realizar análisis descriptivo.

Dicho esto, realmente depende del tipo de empresa a la que se postula. Si está buscando postularse para una startup más pequeña que no tiene un gran equipo, el rol de analista de datos y científico de datos podría fusionarse en 1 rol y se le requerirá que conozca Python o R.

Por otro lado, si está buscando trabajar para una empresa más establecida con equipos más grandes y bien definidos, no requerirán que conozca lenguajes de programación, pero esperarán que tenga un conocimiento mucho más profundo sobre las habilidades que exigir.

Ruta de aprendizaje:

  1. Empiezas con estadísticas básicas, conoces las cosas básicas como media, mediana, r cuadrado, y luego profundizas en la prueba estadística. Usted comprende qué es una prueba estadística, el tipo de prueba y cuándo debe usarla.
  2. Realiza una prueba estadística en un conjunto de datos pequeño, por ejemplo, un conjunto de datos de 1 variable con 20 observaciones. Obtiene una buena comprensión de cómo hacer la cosa por sobresalir.
  3. El conjunto de datos se hizo más grande, de 1 variable a 10 variables, de 20 obs a 20000, se hizo más difícil usar Excel, por lo que usa R. Rehizo todo lo que hizo en Excel, excepto que está en R. Recuerde, R es un herramienta.
  4. Los datos estructurados ya no pueden satisfacerte, intentaste pasar a datos no estructurados, te diste cuenta de que limpiar los datos es una molestia y tu limitada experiencia en programación es el culo.
  5. Te diste cuenta de que R se creó para fines estadísticos y que usar R para manipular datos puede ser un problema, comenzaste a preguntarte si deberías obtener otro lenguaje de programación.
  6. Tienes python, y valió la pena, cada segundo. En el progreso, también seleccionó un idioma de consulta.
  7. Desea predecir mejor las cosas, por lo que comienza a explorar sus opciones con el aprendizaje automático, comprende la teoría y cómo implementarlas. Comprende que la estructura de datos y los algoritmos son importantes, y nunca podría llegar tan lejos, sin abrirse camino a través de ellos.
  8. El problema comercial aleatorio o poco claro ya no le interesa, comienza a querer hacer cosas que le brinden un beneficio real. Escogiste una industria de elección y te diste cuenta de lo poco que te falta, en términos de conocimiento de dominio.

En cuanto a la posición de entrada, bueno, no creo que necesites llegar al número 8 para conseguir un trabajo, pero seamos sinceros, esto es ciencia, y nunca dejas de aprender o no entras en todas.

No tengas miedo de recoger cosas, son herramientas, se pueden recoger y se pueden tirar, es el propósito lo importante.

# Edición 1: se eliminó una línea que se suponía que debía eliminarse (que no se eliminó).

Pasé aproximadamente un año aprendiendo y incursionando en R y estadísticas básicas en mi tiempo libre. Mi trabajo diario en ese momento era un puesto de analista de informes utilizando principalmente Excel, pero me enseñé SQL y cambié a eso.

Obtuve un trabajo de DS ya que ya estaba trabajando en la industria y pude hablar de la industria y la ciencia de datos razonablemente bien, aunque mirando al menos a nivel técnico mis habilidades en ciencia de datos eran bastante rudimentarias. Creo que aprenda todo lo que pueda de Coursera y Edx, pruebe algunos kaggles y luego busque un trabajo de ciencia de datos en su industria actual. Siempre que no seas el único tipo de ciencia de datos, estarás bien. Aprendes mucho más cuando trabajas en el campo.

Los algoritmos y las estructuras de datos importan un poco pero más en el espacio de programación de software. Producir ciencia de datos requerirá comprender más los algoritmos y las estructuras de datos. Pero no es tan relevante para el nivel de entrada,

  1. Sobresalir
  2. SQL
  3. Programación básica (r servirá)
  4. Visualización
  5. Inferencia estadística
  6. Modelado estadístico

No necesita saber informática para el análisis de datos. Necesita aprender un poco o algunas clases de informática para la ciencia de datos. Necesitas saber informática para ingeniería de software o datos

Haga un curso en línea donde pueda hacer análisis de datos usando R. Aprender R como lenguaje no ayudaría mucho si no hace ningún análisis de datos usándolo. R es solo una herramienta y para el análisis de datos también debe tener algún conocimiento sobre estadísticas y aprendizaje automático.

Recomiendo un curso de MIT que lo expondrá a análisis usando R. Es un curso gratuito y no se requieren conocimientos previos.

La ventaja analítica

Si desea hacer un curso corto, puede hacer el siguiente curso. Es un curso básico y se puede completar dentro de 3 a 4 semanas.

Introducción a R para Data Science

More Interesting

¿Podemos hacer aprendizaje automático escalable con R? ¿Puede R trabajar con Hadoop para procesar una matriz de 100 GB?

Estoy trabajando actualmente. Quiero convertirme en un científico de datos. ¿Cuáles fueron los conceptos y tecnologías centrales que necesito aprender?

¿Qué piensan los estadísticos de la ciencia de datos?

¿Cuál es la diferencia entre el análisis empresarial y la ciencia de datos?

¿Cómo se delinean las startups entre las funciones de un científico de datos y una persona analítica más general / orientada a la adquisición?

¿Habrá algún problema para obtener F1 VISA para el programa de ciencia de datos de 1 año GalvanizeU, San Francisco?

¿Puedo obtener un trabajo como analista de datos si aprendo análisis de datos de Internet?

A medida que la tecnología está cambiando tan rápido, ¿una maestría en ciencia de datos será de algún valor en los próximos años?

Dada la opción de buscar SAP o Data Science, ¿cuál va bien y qué es probable que ayude a buscar trabajos para una actualización?

¿Cuál es la diferencia entre un científico de datos y un ingeniero de aprendizaje automático en LinkedIn?

¿Cuáles son las desventajas de hacer una investigación utilizando datos de registros de salud electrónicos anónimos?

Cómo cambiar mi carrera de desarrollador front-end a ciencia de datos / informática científica

¿Cuál es la mejor manera de configurar una estructura de archivo / directorio en una plataforma de Big Data?

¿Qué tipo de habilidades se requieren para probar las pruebas de rendimiento de aplicaciones de big data?

¿Cuál será el alcance de los trabajos de científico de datos en los próximos años?