¿Big Data contiene programación?

El verdadero análisis de Big Data requerirá programación, ya que los conjuntos de datos que exceden los 100 MB se vuelven difíciles para las herramientas basadas en la interfaz de usuario como Excel y Tableau. Por 300 MB, incluso R puede luchar y se necesitarán tecnologías de big data como Hadoop, Hive, Pig y Scala y Spark.

Por otro lado, el análisis empresarial necesita relativamente menos conocimientos de programación y tecnología. Puede sobrevivir con herramientas basadas en la interfaz de usuario como MSBI, Tableau y Excel.

La verdadera pregunta es acerca de usted → ¿Le apasiona codificar y automatizar conocimientos o trabajar más estrechamente con el negocio utilizando herramientas de análisis de negocios e interactuando o asociándose con jugadores tecnológicos?

Si usted es realmente técnico, los grandes datos son para usted, ya que las personas funcionales deberían preferir el análisis empresarial.

Supongo que eres un novato en el dominio de big data. Los entusiastas de Big Data deben tener en cuenta que

  1. Los datos, independientemente de que sean pequeños o grandes, no contienen programación.
  2. Los marcos de procesamiento y almacenamiento de datos, a saber, Apache Hadoop, Apache Spark, se han implementado en Java y Scala.
  3. Al ser un ingeniero / científico de datos, en primer lugar, le encantaría ensuciarse las manos con los datos. Luego viene la parte de minería, modelado y predicción que, en consecuencia, hace uso de metodologías de programación independientemente de la orientación a objetos o secuencias de comandos (Python / R / SAS).

Nunca es tarde para comenzar a aprender. Todo lo mejor 🙂

Si. Contiene programación.

Si bien hay una variedad de herramientas analíticas disponibles en estos días, creo que todavía se requiere codificación para al menos una fracción del proyecto. Algunos casos de uso utilizados en la práctica son la ingeniería de datos, la máquina virtual autodestruible o los contenedores de VM, que gestionan la carga de trabajo de producción. La experiencia humana todavía se necesita para tal caso.

Por supuesto que sí. Pero solo podemos aprender lo que se necesita para manejar un dato. Necesitamos un programa para muchos propósitos, como llamar a una API, crear una tubería de datos, etc. Y es efectivo cuando tratamos datos con programas porque no queremos hacer lo mismo una y otra vez. (Automatizar operaciones de datos por programas)

Yupe..java en mapreduce..y también necesita conceptos básicos de linux ..

More Interesting

Cómo convertirse en un científico de datos, sin las habilidades necesarias

¿Qué es la minería de datos y cuál es su alcance?

MATLAB: ¿Cómo puedo convertir un código para habilitar el procesamiento de bloques con FFT, IFFT y FFT shift para que funcione para big data?

¿Qué universidades ofrecen cursos de ciencias de datos en línea?

¿Cómo es IIT Ropar para el aprendizaje automático o la ciencia de datos?

¿Cuál es el criterio de elegibilidad para aprender análisis de big data?

Cómo convencer a una organización de la importancia de las pruebas A / B

Ciencia de datos: ¿dónde encontrar ejemplos de proyectos usando Python con SQL?

¿Qué se entiende por 'Los datos son el nuevo petróleo'?

Para alguien que esté interesado en la "Ciencia de datos", ¿sería más útil una clase sobre combinatoria o procesos estocásticos?

¿Siempre estamos mejor con más datos en Machine Learning en la práctica?

¿Vale la pena un Master en Business Analytics para convertirse en un Data Scientist o los bootcamps son tan efectivos para conseguir un trabajo para alguien sin experiencia?

He seguido el MOOC de ciencia de datos de la Universidad John Hopkins. ¿A dónde debería ir desde aquí para obtener más información sobre Data Sciences y convertirme en un Junior Data Scientist?

¿Dónde debo comenzar a aprender ML y minería de datos?

¿Cuáles son algunas de las mejores predicciones / pronósticos que se hayan hecho utilizando el aprendizaje automático y las estadísticas computacionales?