Cómo aprender análisis de datos en línea

Construir estadísticas / fundamentos de aprendizaje automático

  • Se espera que un aspirante a científico de datos esté familiarizado con varias estadísticas o metodologías de aprendizaje automático utilizadas en la industria.
  • Uno puede comenzar desde lo básico, es decir, distribución normal, teorema del límite central, prueba de hipótesis y luego pasar a técnicas avanzadas, a saber. regresión lineal, regresión logística, árboles de decisión, análisis de conglomerados, modelos aditivos generalizados, etc.
  • Un libro recomendado para esto sería Los elementos del aprendizaje estadístico (por Hastie, Tibshirani y Friedman).
  • Además de los libros de texto estándar, una forma alternativa pero efectiva de aprendizaje sería utilizar los MOOC. Hay muchos cursos gratuitos de estadísticas / minería de datos disponibles a través de Coursera, edX, MIT open, Stanford en línea, NPTEL, etc.

Adquirir habilidades técnicas en análisis

  • En lo que respecta a las herramientas en la industria analítica, SAS y SPSS solían ser populares antes de que la revolución del código abierto tomara por asalto a la industria. Las herramientas de código abierto como R y Python son la próxima gran novedad y tendría sentido invertir tiempo en ellas.
  • Hay suficientes recursos disponibles gratuitamente en la web para aprender tanto R como Python. Para las personas con habilidades de codificación en lenguajes orientados a objetos como Java, Python encontrará intuitivo. Pero R es la mejor herramienta (opinión personal) cuando se trata de modelado estadístico y también es la herramienta preferida en la academia.
  • Para un principiante absoluto, el curso introductorio en R en Learn R, Python & Data Science Online | DataCamp puede ser un punto de partida. Pero la mejor manera de aprender estos softwares es hacerlo. Por lo tanto, sugeriría que uno debe replicar los códigos disponibles y probarlo en algunos conjuntos de datos ficticios para comprender lo que está sucediendo.
  • Además, un conocimiento práctico de SQL junto con habilidades avanzadas de MS Excel / VBA puede actuar como un diferenciador cuando aparece uno para su entrevista.

Lea sobre las aplicaciones comerciales de Data Science

  • Dado que la ciencia de datos no se trata solo de mumbo jumbo técnico, sería realmente útil si uno comprende las aplicaciones comerciales de este y también conoce varios casos de uso exitosos.
  • Esto lo ayudará a ver el panorama general y también a uno bien equipado para comprender qué tipo de metodología se ajusta a un problema comercial en particular.
  • Por ejemplo, cómo los minoristas utilizan el análisis de la cesta de la compra para agrupar los productos, cómo se puede utilizar el análisis de conglomerados para la segmentación de clientes para el lanzamiento de un nuevo producto, cómo se puede utilizar la regresión logística para la detección de fraudes en el sector bancario / de seguros, etc.

Participa en varios concursos de ciencia de datos

Lo último pero no menos importante sería: práctica, práctica y práctica. Una forma de hacerlo sería participando en varios concursos de ciencia de datos alojados en sitios como kaggle.com.

En GreyAtom, con nuestro plan de estudios ágil, listo para la industria y monitoreo activo de carrera , estaremos allí en cada paso de su viaje para llegar al destino final de convertirse y trabajar como ingeniero de ciencia de datos de Full Stack.

Tendrá un historial de contribuciones de código abierto y ayudará a la comunidad más amplia de ingeniería de software (a través de Github, StackOverflow, un blog o similar).

Puede consultar los detalles del curso haciendo clic en este enlace Full Stack Data Science Engineering | Greyatom

Los datos realmente impulsan todo lo que hacemos. Si le apasiona la ciencia de datos y desea redefinir su carrera, visítenos en el programa en el sitio de GreyAtom: ciencia de datos, aprendizaje automático, Big Data

Creemos que “Aprender = hacer trabajo real”

Enfoque centrado en la práctica para el aprendizaje de la ciencia de datos. Dé el primer paso hacia su viaje en Data Science, programe una sesión de asesoramiento en persona o en video en su momento conveniente, haga clic aquí https://calendly.com/greyatom/co…

Descargo de responsabilidad: soy cofundador de @GreyAtom y ayudar a las personas a encontrar carreras sostenibles en Data Science es mi pasión.

Wow, eso es genial verte interesado en el análisis de datos.

Actualmente estoy aprendiendo Machine Learning y también quiero hacer análisis de datos.

El mejor sitio web para aprender es de Udacity: clases gratuitas en línea y nanodegrados

He aprendido mucho y sigo aprendiendo. Para aprender Análisis de datos, necesita aprender muchas cosas.

Si eres nuevo en la codificación, entonces es perfecto, puedes seguir los cursos disponibles en Udacity.

Aprender análisis de datos :

Parte 1: (1 – 2 meses)

  1. Introducción a la informática.
  2. Introducción a la programación (ND).

Parte 2: (5 – 6 meses)

  1. Estadísticas Indroductoras.
  2. Introducción a las estadísticas descriptivas.
  3. Introducción a las estadísticas inferenciales.

Parte 3: (1-2 meses)

  1. Aprendizaje de Python para análisis y visualización de datos. (De los cursos en línea de Udemy: aprenda cualquier cosa, en su horario)
  2. Programación de bases con Python.

Parte 4: (3 – 4 meses)

  1. Introducción al análisis de datos.
  2. Introducción a la ciencia de datos.

Parte 5: (3 meses)

  1. Introducción a las bases de datos relacionales.
  2. Configuración de servidores web de Linux.
  3. Conceptos básicos de la línea de comandos de Linux.
  4. Estadísticas I y D Pruebas A / B requeridas.
  5. Git y Git Hub.

Parte 6: (2 meses)

Análisis de datos con R (ND)

Parte 7: (10 semanas)

Introducción al aprendizaje automático.

Parte 8: (5 – 6 meses)

  1. Introducción a HTML y CSS.
  2. JavaScript
  3. Visualización de datos.
  4. La disputa de datos con Mango DB.

Parte 9: (378 horas)

Lista de datos de datos (ND). ¡¡Finalmente!!

NOTA:

  • ND significa Cursos de Nano Grado proporcionados por Udacity.
  • No necesariamente necesita hacer algunos de estos cursos, este fue el mapa que hice para mí y creo que es la forma correcta de llegar.
  • Debe verificar los cursos y puede modificar el mapa a su gusto.

Sí, lleva mucho tiempo, valdrá la pena y no te rindas, es divertido e interesante.

¡Aclamaciones! 🙂

Big Data es un término general en ciencia de datos. La mayoría de las personas en estos días solo están acumulando big data sin conocer su origen, que no es más que el análisis estadístico ahora sincronizado con los lenguajes de computadora que nos ayudan a calcular más datos.

Por lo tanto, aprender las funciones estadísticas básicas y los métodos de sus resultados es muy importante si desea tener éxito en el mundo analítico.

Como científico de datos, le sugiero que tenga buenas habilidades en:

1) Análisis predictivo.
2) Análisis de regresión.
3) Análisis de datos basados ​​en texto.
4) Análisis de red.

Mi sugerencia para comenzar con:

1) Siempre puedes optar por los softwares de código abierto como R y también puedes usar una plataforma gratuita llamada Treasurehunt para mejorar estas habilidades.
: Búsqueda del tesoro

2) También puede usar Kaggle, que le proporciona el conjunto de datos para analizar, pero si es un principiante, puede que le resulte difícil.
: kaggle.com

Te sugiero que vayas por el primero suponiendo que eres nuevo en este campo, bueno, por otro lado, si tienes conocimiento sobre el campo, puedes ir por Kaggle.

Personalmente, me gustó el primero porque tiene una interfaz gamificada.

Hay muchas conferencias en video en Youtube o clases gratuitas en línea como Coursera para aprender ciencia de datos. Uno de los aspectos principales de la ciencia de datos es practicar para trabajar con datos de la vida real. Puede tomar cursos en línea, ver videos o leer libros todo lo que quiera, pero eso no ayudará a menos que practique con datos. Para resolver esto, hemos lanzado un concurso “Business Analytics for Beginners Using R” en nuestra plataforma con datos de la vida real. Puede aprender y practicar con los datos dados para perfeccionar sus habilidades.
Business Analytics para principiantes que usan R – Parte I

este curso puede ser útil https://www.coursera.org/course/

More Interesting

¿Cuáles son las ventajas y desventajas de automatizar el proceso de limpieza de un conjunto de datos?

Entrevistas de trabajo de análisis de datos: ¿qué puede decir sobre SQL como herramienta para mostrar sus habilidades?

¿Hay alguna posibilidad de convertirse en un ingeniero de big data sin tener conocimientos de Java o conocimientos de codificación?

¿Cómo manejan los científicos de datos las tareas de aprendizaje automático con características correlacionadas?

¿Cómo se puede usar MySQL para el análisis de big data?

¿Cuál es el significado del procesamiento de datos?

¿Cuál es la diferencia entre trabajar en análisis y ciencia de datos?

¿Cómo es útil la econometría tradicional como la que se enseña en los programas de posgrado en economía para los científicos de datos en la práctica?

¿Debo hacer un master en ciencia de datos o ir a un campo de entrenamiento?

¿Todos los científicos necesitarán saber ciencia de datos?

¿Cuál es el rol del controlador de datos en GDPR?

¿Cuál es la correlación entre PNL, IA, aprendizaje automático, big data y ciencia de datos? ¿Existe una jerarquía o algo en común entre estos? ¿Cómo se relacionan estos problemas con el mundo real?

¿Es aconsejable doble especialización en matemáticas y ciencia de datos si quiero investigar en inteligencia artificial y neurociencia?

¿Cuál es la diferencia entre roaming de datos y datos móviles?

¿Cómo mejorar mis habilidades de depuración en el aprendizaje automático? A menudo me resulta difícil entender por qué un modelo se comporta de cierta manera. ¿Cómo depuran rápidamente los grandes científicos de datos?