¿Qué es un desarrollador de big data?

Big Data Engineer crea lo que el arquitecto de soluciones de big data ha diseñado. Los ingenieros de Big Data desarrollan, mantienen, prueban y evalúan soluciones de Big Data dentro de las organizaciones.

La mayoría de las veces también están involucrados en el diseño de soluciones de big data, debido a la experiencia que tienen con tecnologías basadas en Hadoop como MapReduce, Hive MongoDB o Cassandra. Un ingeniero de big data construye sistemas de procesamiento de datos a gran escala, es un experto en soluciones de almacenamiento de datos y debería poder trabajar con las últimas tecnologías de bases de datos (NoSQL).

Un ingeniero de big data debe tener suficiente experiencia en ingeniería de software antes de que se pueda pasar al campo de big data. Debe haber experiencia con diseño orientado a objetos, codificación y patrones de prueba, así como experiencia en plataformas de software de ingeniería (comercial o de código abierto) e infraestructuras de datos a gran escala. Los ingenieros de Big Data también deberían tener la capacidad de diseñar sistemas distribuidos altamente escalables, utilizando diferentes herramientas de código abierto. Debe comprender cómo funcionan los algoritmos y tener experiencia en la construcción de algoritmos de alto rendimiento.

Un ingeniero de big data debería aceptar el desafío de lidiar con petabytes o incluso exabytes de datos a diario.

Un ingeniero de big data comprende cómo aplicar tecnologías para resolver problemas de big data y desarrollar soluciones innovadoras de big data. Para poder hacer esto, el ingeniero de big data debe tener un amplio conocimiento en diferentes lenguajes de programación o scripting como Java, Linux, C ++, PHP, Ruby, Phyton y / o R. También debe haber conocimiento experto sobre diferentes (NoSQL o RDBMS) como MongoDB o Redis. Construir sistemas de procesamiento de datos con Hadoop y Hive utilizando Java o Python debería ser un conocimiento común para el ingeniero de big data.

Un ingeniero de big data generalmente trabaja en la implementación de proyectos complejos de big data con un enfoque en recopilar, analizar, administrar, analizar y visualizar grandes conjuntos de datos para convertir la información en información utilizando múltiples plataformas. Él o ella deberían poder decidir sobre las necesidades de diseño de hardware y software necesarias y actuar de acuerdo con las decisiones. El ingeniero de big data debería ser capaz de desarrollar prototipos y pruebas de conceptos para las soluciones seleccionadas.

Las calificaciones adicionales deben incluir:

  • Para disfrutar de ser desafiado y resolver problemas complejos diariamente;
  • Tener excelentes habilidades de comunicación oral y escrita;
  • Ser competente en el diseño de flujos de trabajo ETL eficientes y robustos;
  • Para poder trabajar con entornos de computación en la nube;
  • Tener una licenciatura o maestría en ciencias de la computación o ingeniería de software;
  • Poder trabajar en equipo y colaborar con otros para aclarar requisitos;
  • Para poder ayudar a documentar los requisitos, así como resolver conflictos o ambigüedades;
  • Para poder ajustar las soluciones de Hadoop para mejorar el rendimiento y la experiencia del usuario final;
  • Tener fuertes habilidades de coordinación y gestión de proyectos para manejar proyectos complejos.

El ingeniero de big data es un trabajo técnico que requiere una experiencia sustancial en una amplia gama de campos de programación y desarrollo de software. El ingeniero de big data debería tener un conocimiento suficiente de las soluciones de big data para poder implementarlas en las instalaciones o en la nube.

Te doy mi apertura. Piensa en ello lógicamente. Por favor, vota si te ayuda.

La mayor parte del centro de capacitación ofrece hadoop durante 30-50 horas. ¿Es hadoop un tema tan pequeño para aprender en solo 50 horas?

La mayoría de los capacitadores afirman que trabajan en una empresa multinacional de renombre y prometen enseñarle tanto a usted como a su desarrollador. ¿Hay alguna multinacional en el mundo donde un solo individuo tenga experiencia tanto de administrador como de desarrollo?

Prometen cubrir casi más de 10 temas. ¿Podemos aprender cada tema en solo 3 horas?

Dicen que Java no es obligatorio. Todo el hadoop y sus componentes están escritos en Java. ¿Cómo entiende la programación Map-reduce, Pig, Hive UDFs, HBase Clients, todos escritos en Java?

Certificado de finalización del curso. ¿Conseguirás un trabajo cuando digas que aprendí hadoop del centro de capacitación XYZ?

Muy buenos PPT, pero ¿eso cubre todos los detalles?

Si crees que la pregunta anterior es válida, entonces tengo algo mejor para ti.

Hice un currículum de hadoop de 6 meses que contiene completamente manos y lo convertirá en un verdadero experto con mucha práctica.

Puede consultar mis videos gratuitos en la siguiente URL y probarlo.

Hay más de 30 horas de videos disponibles incluso antes de inscribirse con nosotros.

Puede contactarme si está satisfecho con mis sesiones. Encontrarás mi número de contacto en mis videos.

Sesiones de Java de núcleo absolutamente gratis – YouTube

Tutorial de Hadoop – YouTube

Hadoop 2 Series – YouTube

Por favor suscríbase a mi página de Facebook para más actualizaciones.

http://www.facebook.com/hadooplearningcenter

Hay muchas definiciones de big data. Desde el punto de vista de la programación, un desarrollador de Big Data maneja datos que no caben en una sola máquina para producir resultados en un tiempo razonable.

Esto significa que un desarrollador de big data comprende tecnologías como Hadoop o Apache Spark y comprende las formas de cómo procesar datos en paralelo. Desde el punto de vista de los lenguajes de programación, podría centrarse en Java, Python y Scala. Entiende los paradigmas de programación funcional y sabe cómo aplicarlos. También tiene una gran comprensión del ecosistema de las plataformas de big data y conoce las herramientas con las que puede incorporar datos a una plataforma de big data o aplicar el procesamiento de flujo.

Trabaja estrechamente con un ingeniero de sistemas de big data, que comprende el lado de los sistemas de Hadoop y tecnologías similares y sabe cómo definir los requisitos de hardware resp. sabe cómo configurar la gestión de recursos. Las otras personas con las que trabaja son los científicos de Big Data Data que tienen un conocimiento estadístico y matemático rico y que saben cómo aplicar algoritmos de aprendizaje automático en los datos que proporciona un desarrollador de Big Data.

Creo que esto debería ser una cuestión de “quién” y no de “qué”. De todos modos, un desarrollador de big data es alguien que es responsable de la codificación o programación de una aplicación de big data. Tomando a Hadoop como ejemplo, el desarrollador de big data diseña, construye, instala, configura y admite el desarrollo y la implementación de Hadoop.