Durante el último año he usado varios recursos para aprender Apache Spark. He enumerado algunos de ellos a continuación. En ausencia de capacitación en el aula de uno de los empaquetadores establecidos de Spark (Databricks, Hortonworks, MapR, Cloudera, IBM o Microsoft, por nombrar algunos), es mejor que aprenda de estos recursos a continuación.
- Quizás los mejores cursos para aprender Apache Spark son los cursos edX de Databricks. Hay tres cursos disponibles como certificado. Ciencia e ingeniería de datos con Apache® Spark ™. Lo bueno de estos cursos son los videos y cuadernos, que facilitan el aprendizaje de los conceptos clave y retroceden y se desafían con nuevas tareas.
- Introducción a Apache Spark
- Análisis de Big Data con Apache Spark
- Aprendizaje automático distribuido con Apache Spark
- Una excelente manera de adquirir Apache Spark es ver algunas de las conferencias de video de Databricks disponibles en YouTube. Databricks tiene esta introducción (ligeramente anticuada) a Spark. Si tiene un terminal con Spark abierto, puede probar algunos ejemplos simples usted mismo y aprender los conceptos básicos.
- Además de los videos de capacitación, también puede ver algunos videos de casos de uso de Spark:
- Udemy tiene un par de cursos de Frank Kane sobre Apache Spark usando Python y Scala. Estos cursos le cuestan algo de dinero, pero le permiten dar el salto de hacer cosas en la línea de comando o shell de Spark, a secuencias de comandos que pueden analizar grandes conjuntos de datos.
- Apache Spark 2.0 con Scala – ¡Manos a la obra con Big Data!
- Domar Big Data con Apache Spark y Python: ¡manos a la obra!
Además de esto, hay libros útiles y referencias sobre O’Reilly y más. La documentación nativa de Spark es en realidad un buen lugar para comenzar. O’Reilly tiene algunos libros sobre Spark, con Learning Spark y “Advanced Analytics with Spark” en mente.
- ¿Cuál es la diferencia entre un analista de producto y un científico de datos?
- Si pudiera contratar a 4/5 científicos / ingenieros para un equipo de análisis de big data centrado en elegir y responder preguntas comerciales concretas (por ejemplo, predecir una solicitud de producto), ¿cómo lo construiría?
- ¿Qué tipo de productos construye MAD Street Den?
- ¿Cuáles son las oportunidades interesantes en la industria farmacéutica para emprendedores con experiencia en negocios, economía y ciencia de datos?
- Cómo cuidar sus datos de aprendizaje automático cuando hay demasiados experimentos