Respuesta rápida: Python, por supuesto, porque Hadoop no proporciona las bibliotecas a para el análisis.
Déjame explicarte con más detalles.
Python es un lenguaje de programación como cualquier otro lenguaje como C, R, Java o Perl. Un lenguaje de programación proporciona construcciones tales como variables: primitivas y complejas, capacidad para realizar matemáticas, funciones, bucles y capacidad para interactuar con el sistema.
- ¿Por qué, en su opinión, tantas compañías de investigación clínica se niegan a usar Python en lugar de SAS o R?
- ¿Por qué los algoritmos de aprendizaje automático funcionan mejor con datos no correlacionados? ¿Qué sucede cuando normalizamos las funciones?
- Quiero aprender ciencia de datos en un mes. ¿Cómo lo hago?
- ¿Cuáles son las posibilidades del análisis de big data y cómo pueden los big data ayudar a los proveedores de servicios a diario?
- ¿Cuáles son las mejores herramientas de código abierto para un científico de datos?
Al igual que cualquier otro idioma, Python también tiene una gran cantidad de bibliotecas para diversas funciones, como la creación de aplicaciones web, aplicaciones gráficas y análisis de datos.
Mientras que por otro lado tenemos Hadoop que tiene básicamente cuatro componentes principales:
- HDFS: un sistema de archivos para almacenar datos en forma de archivos
- HILO – Un ejecutor de programa genérico en red
- MapReduce: un marco con el que puede ejecutar su lógica utilizando múltiples computadoras
- HBase: un almacén de datos para guardar, actualizar, eliminar, ver datos en forma de tabla
El ecosistema Hadoop también tiene otros componentes como Sqoop (para copiar datos rdms), canal (para recopilar datos en HDFS), Oozie (para crear flujos de trabajo) y mahout (para aprendizaje automático).
El hadoop es un conjunto de herramientas que lo ayudan a realizar la computación paralela en un grupo de computadoras.
Además, puede ejecutar su programa python en el clúster hadoop usando Hadoop Streaming.
Entonces, aunque Hadoop es una plataforma, Python es un lenguaje. Es difícil comparar los dos.