Tengo 10 años de experiencia en mainframe. Estoy tratando de aprender Big Data Analytics. ¿Cómo procedo? No entiendo el mundo distribuido.

Puede continuar con este uno de los mejores cursos de Big Data con 418 LECCIONES y 9 CURSOS, esto lo ayudará a comenzar desde cero y aumentará sus habilidades y capacidades en Big Data Technologies a niveles de dominio más altos.

Nombre del curso: The Big Data Bundle

64.5 horas de Hadoop, MapReduce, Spark y más para prepararlo para una de las carreras de TI de más rápido crecimiento en la actualidad

Descripción del curso:

Este curso cubre las últimas tecnologías de Big Data como Hive, hadoop, Spark, Scala, H Base, Pig, Oozie, Flume & Sqoop.

Temas del curso:

1- De 0 a 1: Hive para el procesamiento de Big Data

Conecte los puntos entre SQL y Hive para mejorar sus habilidades de procesamiento de Big Data

2- Aprenda con el ejemplo: Hadoop y MapReduce para problemas de Big Data

Descubra los métodos de procesamiento de datos masivos utilizando los marcos de datos líderes

3- De 0 a 1: Spark para Data Science en Python

Haga que sus datos vuelen usando Spark para análisis, aprendizaje automático y ciencia de datos

4- Programación escalable con Scala y Spark

Hazte rico usando Scala & Spark para análisis de datos, aprendizaje automático y análisis

5- Aprende con el ejemplo: HBase – La base de datos de Hadoop

Cree bases de datos más flexibles al dominar HBase

6- Pig para disputar Big Data

Conviértase en un controlador de datos bien pagado aprendiendo a cargar, transformar y extraer datos con Pig

7- De 0 a 1: la base de datos distribuida de Cassandra

Conozca la base de datos distribuida de Cassandra y mejore enormemente su currículum de Big Data

8- Oozie: Programación de flujo de trabajo para sistemas de Big Data

Agilice su flujo de trabajo de Big Data aprendiendo a usar flujos de trabajo, coordinadores y paquetes en Oozie

9- Flume & Sqoop para ingerir Big Data

Importe datos de manera eficiente a HDFS, HBase y Hive desde una variedad de fuentes y vea crecer sus perspectivas laborales

Puede obtener este curso en uno de los principales sitios de e-learning disponibles por 49 $, Stack-social, Enlace: – Master Big Data: Hadoop, MapReduce, Hive, Pig, Spark & More .

Espero que esta información del curso ayude.

¿Cómo afectan la ciencia de datos, los grandes datos y el aprendizaje automático al campo de la ingeniería biomédica?

Dada la opción de buscar SAP o Data Science, ¿cuál va bien y qué es probable que ayude a buscar trabajos para una actualización?

¿Cuál es la mejor estadística para buscar una correlación entre los datos de tipo Likert y los datos nominales (sí / no)?

¿Qué piensa la comunidad de Data Science sobre la discriminación contra aquellos sin doctorado de recursos humanos sin educación?

¿Qué temas de informática necesitan aprender para ser un científico de datos? ¿Cómo se aplica en el mundo real? P.ej. colas de prioridad, buscar / ordenar algo

¿Qué es la carga inalámbrica PMA?

Inscriba a algunos cursadores en MOOC, como coursera, udacity, etc. Hay pocos buenos cursadores sobre Big Data de la Universidad de Washington en coursera. Es un buen punto para comenzar. Leer blogs (analyticsvidhya, kdnuggets, etc.), libros, etc.

Jarvis Jones

Obtenga un objetivo claro de lo que le gustaría lograr. Sin un objetivo no puedes tener una trayectoria, por lo tanto, nunca llegas. Ser honesto contigo mismo es un factor importante si puedes superarlo o no.

La motivación será su combustible en este viaje, por lo que necesitará mucho. Quizás la esperanza de un “futuro mejor” lo haga por usted; ¿O el éxito de leer 3 artículos al día sobre varias disciplinas relacionadas te da la madera?

En cualquier caso, MPI le permitirá distribuir su carga de trabajo a través del clúster o dentro de una supercomputadora. Echa un vistazo a la programación de CUDA, esto te dará un impulso en los nodos de aproximadamente 300 veces, si lo hiciste bien. Ten en cuenta que está lejos de ser fácil. MPI no es la única forma de hacer las cosas: puedes usar hadoop mapreduce o rodar el tuyo con alguna pila de comunicación como ZeroMQ y buffers de protocolo.

Entonces, lo anterior lo ayudará a hacer cosas, pero aún necesita completar el espacio en blanco para el análisis. Este es un tema vasto en constante crecimiento que puede involucrar aprendizaje automático, investigación operativa, estadísticas, …

Istvan Varga

Obtenga un libro de introducción de Data Science o Data Analytics como en la serie de Idiots. No es tan dificil.

Y / o regístrese para un curso gratuito de Intro Data Analytics o Data Science Coursera.

La única otra cosa: si su experiencia de mainframe es SysAdmin, es posible que necesite más antes. Depende si puedes seguir la lógica y las estadísticas simples. El análisis de datos más simple es realmente una forma de inteligencia empresarial, donde se resumen y se obtienen promedios, etc., de números que representan personas o transacciones comerciales, como la cantidad promedio de ventas o salarios promedio. Primero entienda eso y luego puede continuar.

Vijayan Nagarajan

En primer lugar, considérelo como un aprendizaje que mejorará su conocimiento de mainframe, ya que en términos simples, es más bien como usar un mainframe grande y único, usaremos múltiples sistemas de productos básicos que no están cerca del tamaño del mainframe, pero juntos pueden lograr Buenos resultados.

Sugeriría tener una mejor comprensión de para qué sirve Big Data. Antes de continuar con Big Data, también puede verificar qué estamos tratando de lograr y cómo. Esto ayudará a comprender las terminologías de Big Data. Paralelamente, si aprende algunos conceptos básicos del lenguaje que utilizará en esto, suponiendo java.

Más tarde, podemos comenzar a buscar ejemplos de código.

Istvan Varga

Udacity es un buen recurso en línea, aunque no he tomado su clase de Big Data

También depende de lo que entiendas por experiencia. Puede trabajar en DevOps haciendo lo que solíamos llamar ‘administración del sistema’. Alternativamente, puede hacer desarrollo, crear sistemas y ‘tuberías’ con nuevos sistemas.

Varun Gulati

More Interesting

¿Cuál sería una buena pila tecnológica para aprender para un ingeniero de datos principiante?

Tengo una experiencia laboral de más de dos años en desarrollo, dispositivos móviles y web. Quiero hacer MS en DS. ¿Mi experiencia ayudaría en el proceso de selección?

¿Qué es mejor: Metis o información para el campo de entrenamiento de ciencia de datos?

¿Qué se considerará más respetable, un puesto de ingeniería de ciencia de datos en IBM Watson o Google?

¿Completan los siguientes dos certificados en ciencia de datos lo suficiente como para ser competitivos para un trabajo de aprendizaje automático si estoy comenzando este campo desde cero?

¿Cuáles son los mejores programas de maestría en ciencias de datos en la India?

¿Cuál es la diferencia entre la captura de datos de cambio y el abastecimiento de eventos?

¿En qué consiste la minería de datos?

¿Cuál es la diferencia entre la desigualdad de Hoeffding y el intervalo de confianza?

Cómo gestionar el big data