Hola
Para iniciar una carrera en el dominio de Big Data como analista de datos o ingeniero de datos, necesita los siguientes requisitos previos:
- Comprensión de la programación (Java es beneficioso para comprender MapReduce)
- Comprensión de SQL
- Aptitud Matemática
Si tiene los requisitos previos mencionados anteriormente, puede aspirar a una carrera prometedora en el dominio de Big Data. Y su comienzo exitoso de una carrera como Analista de datos o Ingeniero de datos requerirá una comprensión profunda de lo siguiente:
- ¿Consejos prácticos para el aprendizaje automático?
- ¿Cuáles son las desventajas de hacer una investigación utilizando datos de registros de salud electrónicos anónimos?
- ¿Puedo hacer cosas de aprendizaje automático / minería de datos sin ser un "tomador de decisiones"?
- Alguien sugirió que "la gente asume que los proveedores [en big data] no van a comenzar a ofrecer herramientas / IU que el lego con conocimientos básicos de estadísticas podría aprovechar". ¿Se comercializará la ciencia de datos?
- ¿Hacer Zipfian (para ciencia de datos) o Iron Yard (diseño web) sinergizaría mejor con mis habilidades de ingeniería front-end?
- Hadoop Stack (HDFS, Zookeeper, Yarn, MapReduce, Pig, Hive, Sqoop, Flume, Oozie, etc.)
- Spark (Scala, conceptos básicos de Spark, RDD, Kafka, DataFrames, limpieza de datos, Spark Streaming, Spark SQL, Hive-on-Spark, procesamiento y análisis de gráficos, aprendizaje automático, GraphX, SparkR, etc.)
Y si bien aprender Hadoop solo puede ayudarlo a usted, recomiendo sinceramente aprender Hadoop y Spark, ya que Spark tiene mucho más potencial. Con esta comprensión, nosotros en CloudxLab hemos diseñado nuestro curso sobre “Big Data con Hadoop & Spark” para que los aspirantes como puede completar el curso y comenzar rápidamente su carrera en Big Data. Puedes consultar los detalles aquí. También tenga en cuenta que aprender los conceptos será beneficioso solo cuando realice prácticas en un grupo real de computadoras a las que se pueda acceder en línea desde cualquier lugar y desde cualquier dispositivo, y en CloudxLab proporcionamos esta plataforma para la práctica práctica real. Por supuesto, también debe explorar otras opciones antes de decidir.