Las ciencias de datos y el análisis de datos son campos de rápido crecimiento, hay una escasez de solicitantes calificados para la cantidad de trabajos disponibles. Esto hace que la ciencia de datos sea un campo prometedor y lucrativo para cualquier persona interesada y que busque una nueva carrera. En primer lugar, aprenda matemáticas básicas y estadísticas necesarias para la ciencia de datos. Desarrollar una comprensión básica de los algoritmos de aprendizaje automático. Trabajar en proyectos y crear una cartera de proyectos. Habilidades requeridas para obtener su primera pasantía / trabajo en ciencia de datos.
pasos que debe seguir para convertirse en un científico de datos:
- ¿Cuáles son los temas más importantes para un futuro estadístico?
- Cómo medir la calidad de un proyecto de ciencia de datos
- ¿Cuáles son algunos ejemplos de cómo se aplica la ciencia de datos en la inversión?
- Estoy planeando aprender la herramienta de visualización de datos, ¿cuál debería considerar tableau, Qlik view, Power BI?
- ¿Dónde puedo encontrar datos para construir un modelo de prepago de hipoteca usando conceptos de ciencia de datos?
- Repasar sus habilidades matemáticas y estadísticas. Un buen científico de datos debe ser capaz de comprender lo que le dicen los datos y, para hacerlo, debe tener un álgebra lineal básica sólida, una comprensión de los algoritmos y las habilidades estadísticas. Se pueden requerir matemáticas más avanzadas para ciertas posiciones, pero este es un buen lugar para comenzar.
- Comprender el concepto de aprendizaje automático. El aprendizaje automático está emergiendo como la próxima palabra de moda, pero está indisolublemente vinculado a los grandes datos. El aprendizaje automático utiliza algoritmos de inteligencia artificial para convertir los datos en valor y aprender sin ser programados explícitamente.
- Aprende a codificar. Los científicos de datos deben saber cómo manipular el código para decirle a la computadora cómo analizar los datos. Comience con un lenguaje de código abierto como Python y vaya desde allí.
- Comprenda las bases de datos, los lagos de datos y el almacenamiento distribuido. Los datos se almacenan en bases de datos, lagos de datos o en redes distribuidas, y la forma en que se construyen esos repositorios de datos a menudo puede determinar cómo puede acceder, usar y analizar esos datos. No ver el panorama general o pensar en el futuro cuando construye su almacenamiento de datos puede tener consecuencias de largo alcance.
- Aprenda técnicas de limpieza de datos y munging. La mezcla de datos es el proceso de convertir datos “en bruto” a otro formato que sea más fácil de acceder y analizar. La limpieza de datos ayuda a eliminar la duplicación y los datos “malos”. Ambas son herramientas esenciales en la caja de herramientas de un científico de datos.
- Comprenda los conceptos básicos de una buena visualización de datos e informes. No es necesario que se convierta en diseñador gráfico, pero sí debe estar bien versado sobre cómo crear informes de datos que una persona laica, como su gerente o CEO, pueda entender.
- Agregue más herramientas a su caja de herramientas. Una vez que haya dominado las habilidades anteriores, es hora de expandir su caja de herramientas de ciencia de datos para incluir programas como Hadoop, R y Spark. El conocimiento y la experiencia con estas herramientas lo colocarán por encima de una gran cantidad de solicitantes de empleo en ciencia de datos.
- Práctica. ¿Cómo practicas la ciencia de datos antes de tener un trabajo en el campo? Desarrolle su propio proyecto favorito a partir de datos de código abierto, participe en concursos, trabaje en red con científicos de datos que trabajan, únase a un campamento de entrenamiento, sea voluntario o pasante. Los mejores científicos de datos tendrán experiencia e intuición en el campo y podrán mostrar su trabajo a un reclutador.
- Conviértete en parte de la comunidad. Siga a los líderes de opinión en la industria, lea los blogs y sitios web de la industria, participe, haga preguntas y manténgase al tanto de las noticias y la teoría actual.
Puede aprender ciencia de datos a través de algunos cursos en línea:
- Los mejores cursos en línea de ciencia de datos:
Data Science AZ ™: ejercicios de ciencia de datos de la vida real incluidos - Bootcamp de ciencia de datos y aprendizaje automático con R
Elija el primer curso porque es ampliamente utilizado:
Libros de texto de ciencia de datos sugeridos: (solo con fines de referencia)
- Ciencia de datos desde cero: primeros principios con Python por Joel Grus
- Data Science for Business: lo que necesita saber sobre minería de datos y pensamiento analítico de datos
TODO LO MEJOR………………..