Hola
Para iniciar una carrera en el dominio de Big Data como analista de datos o ingeniero de datos, necesita los siguientes requisitos previos:
- Comprensión de la programación (Java es beneficioso para comprender MapReduce)
- Comprensión de SQL
- Aptitud Matemática
Si tiene los requisitos previos mencionados anteriormente, puede aspirar a una carrera prometedora en el dominio de Big Data.
- ¿Qué sistema operativo es mejor para Python, R y data science, Mac o Windows?
- ¿Cuál es el mejor programa de ciencia de datos?
- ¿Cuál es una explicación amable de GradientBoost?
- ¿Qué algoritmos se utilizan para resolver problemas de aprendizaje automático basados en gráficos?
- ¿Puedo usar RStudio para la minería de datos donde necesito tomar un conjunto de datos de detección de intrusos? ¿Alguna sugerencia?
Y su exitoso comienzo en una carrera como analista de datos o ingeniero de datos requerirá una comprensión profunda de lo siguiente:
- Hadoop Stack (HDFS, Zookeeper, Yarn, MapReduce, Pig, Hive, Sqoop, Flume, Oozie, etc.)
- Spark (Scala, conceptos básicos de Spark, RDD, Kafka, DataFrames, limpieza de datos, Spark Streaming, Spark SQL, Hive-on-Spark, procesamiento y análisis de gráficos, aprendizaje automático, GraphX, SparkR, etc.)
Y aunque aprender Hadoop solo puede ayudarlo a comenzar, le recomiendo sinceramente aprender Hadoop y Spark, ya que Spark tiene mucho más potencial.
Con esta comprensión, nosotros en CloudxLab hemos diseñado nuestro curso sobre “Big Data con Hadoop & Spark” para que los aspirantes como usted puedan completar el curso y comenzar su carrera en Big Data. Puedes consultar los detalles aquí. También tenga en cuenta que aprender los conceptos será beneficioso solo cuando realice prácticas en un grupo real de computadoras a las que se pueda acceder en línea desde cualquier lugar y desde cualquier dispositivo, y en CloudxLab proporcionamos esta plataforma para la práctica práctica real. .
Por supuesto, también debe explorar otras opciones antes de decidir.