No dolerá saber ambos.
Java para ingeniería de datos
Python para ciencia de datos
- Tengo mi doctorado y trabajo en un observatorio. ¿Debo dejar atrás mi carrera como científico académico? ¿Debo dar el salto a la industria como científico de datos, o la ciencia de datos es solo una moda?
- ¿Es realmente necesario saber la codificación Java para Big Data? ¿Es posible aprender Big Data sin conocimiento de Java?
- ¿Cómo se puede aumentar artificialmente la varianza de un conjunto de datos?
- ¿Cuál es el mejor libro para aprender Python para la ciencia de datos?
- En el enfoque ágil de la ingeniería de software, ¿qué sucede cuando la visión del propietario del producto contradice el análisis del investigador de los datos del usuario?
¿Cuál es la idea básica / funcionalidad detrás de MapReduce?
Toda la idea de mapeo y reducción está cubierta en las secuencias de Java. Por ejemplo, Apache {Hadoop, HBase, Hive} están escritos en Java. Como Data Scientist, conocer Java debería darte una ventaja, ya que eventualmente utilizarás Hadoop, Hive y otros.
Si eres propietario de una tienda de sándwiches o estás pensando en tener uno, no deberías usar este MapReduce en la imagen. Este es un mapeador con un reductor hiperactivo.
El culpable en el reductor hiperactivo podría deberse al acumulador y al combinador disfuncionales en el reductor. Si usa esto, pronto cerrará su negocio. Usted ha sido advertido. 🙂
Crédito de la foto: ¿Qué es Map-Reduce?