En cualquier lugar o en todas partes.
- ¿Configurando Hadoop Env en su clúster? Hadoop y la mayoría de sus aplicaciones están escritas en Java .
- ¿Transmisión de datos desde sus cintas o fuentes a la plataforma Hadoop? Puede usar Java pero no necesariamente. ¿ Usas Flume ? Escrito en Java. Kafka ? Scala (lenguaje de programación) . ¿Escribes tu marco personalizado? Puedes escribir en Python o Java.
- Una vez que los datos están en HDFS, puede usar Java para escribir RecordReaders o Schema Readers, etc. para usar sus datos en Pig o Hive . Sí, Java también se puede usar aquí.
- ¿Quieres correr Spark ? Escrito en Scala y mejor usar Scala.
- No Spark? ¿Otras opciones para ejecutar algoritmos de Machine Learning ? Puedes usar Java ( Weka )
- ¿Enviar resultados a alguna de las plataformas de visualización? Es bastante simple con el crecimiento en compañías como Tableau (producto) o Tibco Spotfire . No necesitas hacer mucho aquí. Todo está fuertemente construido para ti (90%)
Para que pueda usar Java en cualquier lugar que desee. Es solo preferencia, conveniencia y experiencia.
- ¿Cuánto durará la tendencia al alza en el campo de la ciencia de datos?
- ¿Cuál es el significado de los derivados de datos en el contexto de big data?
- ¿Puedo aprender minería de datos sin aprendizaje automático?
- ¿Qué datos debo tener en cuenta al comparar el crecimiento de los países?
- ¿Hay alguna reunión de ciencia de datos en Chennai, India?