A2A
Tenga en cuenta que algunas personas dicen que se necesitan 20,000 horas para convertirse en un verdadero maestro en una disciplina. También es la pregunta desde qué nivel comienzas?
Conocimientos básicos: antes de poder lidiar con Big Data, necesita una comprensión sólida de
- ¿Qué hace el equipo de datos en Addepar?
- ¿Revisará mi currículum para los puestos de Analista de datos / Científico de datos y proporcionará algunos comentarios?
- ¿Es aconsejable doble especialización en matemáticas y ciencia de datos si quiero investigar en inteligencia artificial y neurociencia?
- ¿Cuál es la mejor tecnología, ciencia de datos o big data?
- ¿De qué maneras es importante la investigación matemática fundamental en espacios de alta dimensión (por ejemplo, geometría / topología) importante para la ciencia de datos y el aprendizaje automático?
- Sistema operativo
- Teoría de la base de datos
- Programación
Entonces tiene sentido dividir en los siguientes campos
- Operaciones
Comprender las plataformas de datos, como cómo funcionan Hadoop y otros sistemas
- Ingeniería de datos
Motores de procesamiento de datos como Apache Spark
- Analítica
Aplicaciones de aprendizaje automático
- Negocio de Big Data
Gobierno de datos, cómo las personas ganan dinero con Big Data y más
La clave es que, como excelente ingeniero de datos, deberá conocer los cuatro campos. Aún más si te consideras un arquitecto.
Luego puede construir para cada campo un mapa de ruta. Específicamente con Data Engineering, recomiendo profundizar en los siguientes campos.
- Dominar la línea de comando de Linux
- Dominando Docker y Vagabundo
- Entendiendo a Hadoop desde cero
- Comprender el procesamiento de datos desde cero
- Sistemas de mensajería como Kafka
- Programacion Funcional
También recomendaría suscribirse a hadoop semanalmente e intentar comprender de qué se trata.