Me hace muy feliz ver a alguien tan apasionado por la ciencia de datos. El “trabajo más sexy del siglo XXI” es ayudar a las organizaciones a tomar decisiones estratégicas basadas en datos.
Para aprender ciencia de datos, te sugiero que vayas a un instituto de capacitación. Por qué sugiero unirse a un instituto es porque ordenan disciplina y experiencia. Hay ciertas habilidades que no puedes aprender en línea o por ti mismo. Por ejemplo, encontrará una gran cantidad de materiales y contenido en línea sobre “Cómo convertirse en médico”. Pero, no será médico a menos que esté capacitado y lo suficientemente capacitado como para inyectar medicamentos a un paciente. Esto también se aplica a la ciencia de datos. La capacitación adecuada en el aula ayuda a desarrollar las habilidades prácticas necesarias para convertirse en un científico de datos.
Dado que está en el último año, estoy seguro de que debe conocer las habilidades necesarias para sobresalir en la ciencia de datos. Si no, aquí tienes.
- ¿Cuál es la diferencia entre Empirical Bayes e inferencia bayesiana?
- ¿Cuáles son los temas sobre big data para hacer una tesis de maestría que excluye el aprendizaje automático?
- ¿Cómo funciona el aprendizaje automático en el comercio algorítmico (finanzas)?
- ¿Se puede usar un C ++ para el aprendizaje automático? Si es así, ¿qué tan bueno es en comparación con Python y R?
- ¿Cuáles son algunos buenos recursos para conceptos sobre la identificación de similitudes entre documentos?
Habilidades técnicas
- Matemáticas (por ejemplo, álgebra lineal, cálculo y probabilidad)
- Estadísticas (por ejemplo, pruebas de hipótesis y estadísticas resumidas)
- Herramientas y técnicas de aprendizaje automático (p. Ej., Vecinos más cercanos, bosques aleatorios, métodos de conjunto, etc.)
- Habilidades de ingeniería de software (por ejemplo, computación distribuida, algoritmos y estructuras de datos)
- Minería de datos
- Limpieza de datos y munging
- Visualización de datos (por ejemplo, ggplot y d3.js) y técnicas de informes
- Técnicas de datos no estructurados.
- Lenguajes R y / o SAS
- Bases de datos SQL y lenguajes de consulta de bases de datos
- Python (más común), C / C ++ Java, Perl
- Grandes plataformas de datos como Hadoop, Hive y Pig
- Herramientas en la nube como Amazon S3
Habilidades para los negocios
- Solución analítica de problemas: abordar desafíos de alto nivel con un ojo claro sobre lo que es importante; empleando el enfoque / métodos correctos para aprovechar al máximo el tiempo y los recursos humanos.
- Comunicación efectiva: Detallando sus técnicas y descubrimientos a audiencias técnicas y no técnicas en un lenguaje que puedan entender.
- Curiosidad intelectual: explorar nuevos territorios y encontrar formas creativas e inusuales para resolver problemas.
- Conocimiento de la industria: Comprender la forma en que funciona la industria elegida y cómo se recopilan, analizan y utilizan los datos.
Si tiene las habilidades mencionadas anteriormente en gran medida, es bueno. Pero, ¿cómo puede la industria ver las habilidades que posee? A menos que y hasta que no muestre las habilidades al mundo exterior, nadie sabrá sobre usted y sobre los modelos y datos complejos en los que ha trabajado.
Aquí viene el punto de tener un perfil en GitHub, Stack Overflow, Kaggle, etc. Estas son plataformas y comunidades en línea en las que puede mostrar su trabajo trabajando en proyectos, contribuir a otros proyectos, mostrar su trabajo anterior, hacer preguntas, escribir blogs y ser parte de la comunidad.
La presencia en dichas plataformas lo ayudará a aprender las mejores prácticas de codificación. Además, construyó una cartera demostrable a medida que trabaja en diferentes proyectos / desafíos. Recuerde, los posibles empleadores contratan con HABILIDAD DEMOSTRADA en lugar de con pedigrí O certificaciones.
Si está planeando aprender ciencia de datos, le sugiero que asista a un programa que se base en el aula, que esté muy orientado a la práctica y dirigido por un instructor.
Pocos puntos básicos a considerar al elegir un programa son
- El énfasis está más en la práctica y no solo en la teoría.
- El proyecto se basa en enunciados de problemas relevantes de la industria y no en las tareas antiguas
- Los aprendizajes y proyectos son colaborativos y se realizan en equipos.
- Obtiene herramientas reales de la industria y se enfoca en el desarrollo basado en pruebas
Descargo de responsabilidad: soy cofundador de @GreyAtom y ayudo a talentos de ingeniería a encontrar carreras sostenibles en tecnologías emergentes.
El programa insignia altamente selectivo de GreyAtom tiene como objetivo orientar a los profesionales que trabajan y los más novedosos en el inicio de su carrera de ciencia de datos. Los estudiantes crearon proyectos a partir de conjuntos de datos REALES y declaraciones de problemas proporcionadas por nuestra industria y socios de contratación. El programa se basa en el aula y se basa en la práctica. GreyAtom es un ecosistema donde los estudiantes pueden aprovechar lo mejor de la academia, profesionales de la industria y personas influyentes.
Algunos enlaces rápidos
- Programa – http://www.greyatom.com/full-sta…
Chatee con un consejero académico: le invitamos a compartir todas sus dudas e inseguridades, a las que haremos todo lo posible para guiarlo hacia su camino profesional hacia el éxito. https://calendly.com/greyatom/co…