Cómo comenzar a trabajar con el análisis de datos

Construir estadísticas / fundamentos de aprendizaje automático

  • Se espera que un aspirante a científico de datos esté familiarizado con varias estadísticas o metodologías de aprendizaje automático utilizadas en la industria.
  • Uno puede comenzar desde lo básico, es decir, distribución normal, teorema del límite central, prueba de hipótesis y luego pasar a técnicas avanzadas, a saber. regresión lineal, regresión logística, árboles de decisión, análisis de conglomerados, modelos aditivos generalizados, etc.
  • Un libro recomendado para esto sería Los elementos del aprendizaje estadístico (por Hastie, Tibshirani y Friedman).
  • Además de los libros de texto estándar, una forma alternativa pero efectiva de aprendizaje sería utilizar los MOOC. Hay muchos cursos gratuitos de estadísticas / minería de datos disponibles a través de Coursera, edX, MIT open, Stanford en línea, NPTEL, etc.

Adquirir habilidades técnicas en análisis

  • En lo que respecta a las herramientas en la industria analítica, SAS y SPSS solían ser populares antes de que la revolución del código abierto tomara a la industria por sorpresa. Las herramientas de código abierto como R y Python son la próxima gran novedad y tendría sentido invertir tiempo en ellas.
  • Hay suficientes recursos disponibles gratuitamente en la web para aprender tanto R como Python. Para las personas con habilidades de codificación en lenguajes orientados a objetos como Java, Python encontrará intuitivo. Pero R es la mejor herramienta (opinión personal) cuando se trata de modelado estadístico y también es la herramienta preferida en la academia.
  • Para un principiante absoluto, el curso introductorio en R en Learn R, Python & Data Science Online | DataCamp puede ser un punto de partida. Pero la mejor manera de aprender estos softwares es hacerlo. Por lo tanto, sugeriría que uno debe replicar los códigos disponibles y probarlo en algunos conjuntos de datos ficticios para comprender lo que está sucediendo.
  • Además, un conocimiento práctico de SQL junto con habilidades avanzadas de MS Excel / VBA puede actuar como un diferenciador cuando aparece uno para su entrevista.

Lea sobre las aplicaciones comerciales de Data Science

  • Dado que la ciencia de datos no se trata solo de mumbo jumbo técnico, sería realmente útil si uno comprende las aplicaciones comerciales de este y también conoce varios casos de uso exitosos.
  • Esto lo ayudará a ver el panorama general y también a uno bien equipado para comprender qué tipo de metodología se ajusta a un problema comercial en particular.
  • Por ejemplo, cómo los minoristas utilizan el análisis de la cesta de la compra para agrupar los productos, cómo se puede utilizar el análisis de conglomerados para la segmentación de clientes para el lanzamiento de un nuevo producto, cómo se puede utilizar la regresión logística para la detección de fraudes en el sector bancario / de seguros, etc.

Participa en varios concursos de ciencia de datos

Lo último pero no menos importante sería: práctica, práctica y práctica. Una forma de hacerlo sería participando en varios concursos de ciencia de datos alojados en sitios como kaggle.com.

En GreyAtom, con nuestro plan de estudios ágil, listo para la industria y monitoreo activo de carrera , estaremos allí en cada paso de su viaje para llegar al destino final de convertirse y trabajar como ingeniero de ciencia de datos de Full Stack.

Tendrá un historial de contribuciones de código abierto y ayudará a la comunidad más amplia de ingeniería de software (a través de Github, StackOverflow, un blog o similar).

Puede consultar los detalles del curso haciendo clic en este enlace Full Stack Data Science Engineering | Greyatom

Los datos realmente impulsan todo lo que hacemos. Si le apasiona la ciencia de datos y desea redefinir su carrera, visítenos en el programa en el sitio de GreyAtom: ciencia de datos, aprendizaje automático, Big Data

Creemos que “Aprender = hacer trabajo real”

Enfoque centrado en la práctica para el aprendizaje de la ciencia de datos. Dé el primer paso hacia su viaje en Data Science, programe una sesión de asesoramiento en persona o en video en su momento conveniente, haga clic aquí https://calendly.com/greyatom/co…

Descargo de responsabilidad: soy cofundador de @GreyAtom y ayudar a las personas a encontrar carreras sostenibles en Data Science es mi pasión.

¿Es esto para un proyecto específico? Primero debe elegir la pregunta para la que desea una respuesta basada en los datos. Entonces podría ser más fácil para las personas guiarte hacia métodos de análisis adecuados.

Por supuesto, mirar sus datos también es un primer paso natural. Sus palabras clave aquí serían visualización de datos, diagramas de dispersión, histogramas.

Dado que sus datos se basan en la red, también puede intentar extraer medidas teóricas de gráficos (medidas de centralidad, etc.). Esto podría requerir un poco de limpieza de datos (eliminar errores claros, crear nuevas variables, etc.).

¡Muchas avenidas! Por favor, elabora para obtener mejores respuestas.

Los trabajos de analista de datos de nivel de entrada se pueden destilar a estos 4 atributos:

  • Conocimientos básicos de estadística y probabilidad.
  • Usuario intermedio de Microsoft Excel
  • Poder escribir consultas SQL
  • Fuerte ética de trabajo e interesado en datos

Tendrás que comenzar con lo básico. También soy un amante de los análisis de datos 🙂 y encontré este sitio que ha sido realmente útil hasta ahora. Aprenda ciencia de datos interactivamente en línea. Comience gratis. Te lleva desde lo más básico a los temas más avanzados.

More Interesting

Cómo aprender ciencia de datos con un conocimiento intermedio de Python

¿Cuál es el futuro de la ciencia de datos en los próximos años? ¿Cómo es el mercado laboral en ciencia de datos para los graduados de nivel de entrada? ¿Es fácil de aprender, o necesitamos hacer más y más trabajo duro para conseguir un trabajo de nivel de entrada?

¿Cuál es la diferencia entre el análisis de datos con Python y el análisis de datos con Python en Apache Spark?

¿Cómo funciona el análisis espacial con datos topológicos?

¿Cuáles son los casos de uso de Docker en Data Science y Machine Learning?

Cómo saber qué datos tiene Acxiom sobre mí

¿En qué cosas tienen que pasar el tiempo los científicos de datos que preferirían no hacerlo?

¿Cuál es una mejor herramienta para aprender para análisis visual-Tableau o SAS? Teniendo en cuenta la facilidad, la complejidad y las perspectivas laborales.

Actualmente, tengo SAP HANA como un conjunto de habilidades. ¿Debo elegir la ciencia de datos como mi futura carrera?

Cómo ver la pista de big data relacionada con su carrera objetivo

Cómo analizar mis datos fácilmente y mejorar mi negocio

¿Qué deportes son más conocidos por el análisis de datos?

¿Se ha trabajado en el uso del aprendizaje profundo para motores de recomendación?

¿Existe una forma más eficiente de almacenar tablas y filas sin tener que repetir ID?

Cómo engañar a los algoritmos de 'Big Data' para evitar el perfil y la orientación precisos de mí mismo