Tengo 10 años de experiencia en mainframe. Estoy tratando de aprender Big Data Analytics. ¿Cómo procedo? No entiendo el mundo distribuido.

Puede continuar con este uno de los mejores cursos de Big Data con 418 LECCIONES y 9 CURSOS, esto lo ayudará a comenzar desde cero y aumentará sus habilidades y capacidades en Big Data Technologies a niveles de dominio más altos.

Nombre del curso: The Big Data Bundle

64.5 horas de Hadoop, MapReduce, Spark y más para prepararlo para una de las carreras de TI de más rápido crecimiento en la actualidad

Descripción del curso:

Este curso cubre las últimas tecnologías de Big Data como Hive, hadoop, Spark, Scala, H Base, Pig, Oozie, Flume & Sqoop.

Temas del curso:

1- De 0 a 1: Hive para el procesamiento de Big Data

Conecte los puntos entre SQL y Hive para mejorar sus habilidades de procesamiento de Big Data

2- Aprenda con el ejemplo: Hadoop y MapReduce para problemas de Big Data

Descubra los métodos de procesamiento de datos masivos utilizando los marcos de datos líderes

3- De 0 a 1: Spark para Data Science en Python

Haga que sus datos vuelen usando Spark para análisis, aprendizaje automático y ciencia de datos

4- Programación escalable con Scala y Spark

Hazte rico usando Scala & Spark para análisis de datos, aprendizaje automático y análisis

5- Aprende con el ejemplo: HBase – La base de datos de Hadoop

Cree bases de datos más flexibles al dominar HBase

6- Pig para disputar Big Data

Conviértase en un controlador de datos bien pagado aprendiendo a cargar, transformar y extraer datos con Pig

7- De 0 a 1: la base de datos distribuida de Cassandra

Conozca la base de datos distribuida de Cassandra y mejore enormemente su currículum de Big Data

8- Oozie: Programación de flujo de trabajo para sistemas de Big Data

Agilice su flujo de trabajo de Big Data aprendiendo a usar flujos de trabajo, coordinadores y paquetes en Oozie

9- Flume & Sqoop para ingerir Big Data

Importe datos de manera eficiente a HDFS, HBase y Hive desde una variedad de fuentes y vea crecer sus perspectivas laborales

Puede obtener este curso en uno de los principales sitios de e-learning disponibles por 49 $, Stack-social, Enlace: – Master Big Data: Hadoop, MapReduce, Hive, Pig, Spark & ​​More .

Espero que esta información del curso ayude.

Inscriba a algunos cursadores en MOOC, como coursera, udacity, etc. Hay pocos buenos cursadores sobre Big Data de la Universidad de Washington en coursera. Es un buen punto para comenzar. Leer blogs (analyticsvidhya, kdnuggets, etc.), libros, etc.

Obtenga un objetivo claro de lo que le gustaría lograr. Sin un objetivo no puedes tener una trayectoria, por lo tanto, nunca llegas. Ser honesto contigo mismo es un factor importante si puedes superarlo o no.

La motivación será su combustible en este viaje, por lo que necesitará mucho. Quizás la esperanza de un “futuro mejor” lo haga por usted; ¿O el éxito de leer 3 artículos al día sobre varias disciplinas relacionadas te da la madera?

En cualquier caso, MPI le permitirá distribuir su carga de trabajo a través del clúster o dentro de una supercomputadora. Echa un vistazo a la programación de CUDA, esto te dará un impulso en los nodos de aproximadamente 300 veces, si lo hiciste bien. Ten en cuenta que está lejos de ser fácil. MPI no es la única forma de hacer las cosas: puedes usar hadoop mapreduce o rodar el tuyo con alguna pila de comunicación como ZeroMQ y buffers de protocolo.

Entonces, lo anterior lo ayudará a hacer cosas, pero aún necesita completar el espacio en blanco para el análisis. Este es un tema vasto en constante crecimiento que puede involucrar aprendizaje automático, investigación operativa, estadísticas, …

Obtenga un libro de introducción de Data Science o Data Analytics como en la serie de Idiots. No es tan dificil.

Y / o regístrese para un curso gratuito de Intro Data Analytics o Data Science Coursera.

La única otra cosa: si su experiencia de mainframe es SysAdmin, es posible que necesite más antes. Depende si puedes seguir la lógica y las estadísticas simples. El análisis de datos más simple es realmente una forma de inteligencia empresarial, donde se resumen y se obtienen promedios, etc., de números que representan personas o transacciones comerciales, como la cantidad promedio de ventas o salarios promedio. Primero entienda eso y luego puede continuar.

En primer lugar, considérelo como un aprendizaje que mejorará su conocimiento de mainframe, ya que en términos simples, es más bien como usar un mainframe grande y único, usaremos múltiples sistemas de productos básicos que no están cerca del tamaño del mainframe, pero juntos pueden lograr Buenos resultados.

Sugeriría tener una mejor comprensión de para qué sirve Big Data. Antes de continuar con Big Data, también puede verificar qué estamos tratando de lograr y cómo. Esto ayudará a comprender las terminologías de Big Data. Paralelamente, si aprende algunos conceptos básicos del lenguaje que utilizará en esto, suponiendo java.

Más tarde, podemos comenzar a buscar ejemplos de código.

Udacity es un buen recurso en línea, aunque no he tomado su clase de Big Data

También depende de lo que entiendas por experiencia. Puede trabajar en DevOps haciendo lo que solíamos llamar ‘administración del sistema’. Alternativamente, puede hacer desarrollo, crear sistemas y ‘tuberías’ con nuevos sistemas.