¿Cuál es la mejor tecnología para procesar big data además de Hadoop y Spark?

Debería expresar con más precisión qué piensa con el término tecnología. Cuando se refiere a Hadoop, considera un conjunto de tecnologías que abarcan el sistema de archivos, la base de datos y el software de procesamiento. En el mostrador, Spark es un modelo de procesamiento que puede ejecutarse en Hadoop o solo.

Si se refiere (como supongo) a modelos de procesamiento (y en este caso cuando nombra a Hadoop, probablemente se refiera a MapReduce), todavía depende de qué espera de sus datos y qué tipo de análisis desea ejecutar. Si necesita un motor de transmisión, puede consultar Apache Storm. Si quieres un procesador gráfico, Apache Giraph es un buen ejemplo. Si necesita algo de aprendizaje automático, consulte H2O o Apache Mahout.

En el mostrador, si incluso supera el universo Hadoop y Spark, otra solución que nombraría son las tecnologías NewSQL, impulsadas por un procesamiento paralelo masivo (MPP). Sin embargo, tienen un propósito muy diferente (análisis de datos principalmente estructurados).

Análisis deApache HadoopApache SparkBig DataBig Data AnalysisCiencia de datosdatosTecnología

Related Content

No me gusta la minería de datos, pero estoy interesado en el aprendizaje automático, ¿debería seguir estudiando ML para estudios superiores?

¿Existe alguna metodología como OOP que guíe cómo diseñar un software de procesamiento de datos?

¿Se acabará alguna vez la información?

¿Cuál es el futuro del aprendizaje automático en las finanzas?

Quiere aprender Big data. ¿Cómo debo aprender desde una perspectiva de prueba, por favor responda?

Cómo comenzar una carrera con Big Data y cuál es la forma de conseguir un trabajo en Big Data como una forma más fresca

¿Cuáles son las reglas de uso justo para permitir que un usuario cite contenido en un sitio web para publicar en otro sitio web?

SAS HPA
SAS / Acceso a Hadoop
Servidor SAS LASR
SAS Data Loader para Hadoop

(Trabajo en algunos de estos productos)

Mario Mantero

Existen muchas tecnologías para procesar Big Data además de Hadoop y Spark, hay varias otras tecnologías como Pentaho, Tableau, Jaspersoft, Datascience, Casandra y muchas otras. Para profundizar en las tecnologías, revise la siguiente tinta. Podrá obtener un concepto claro para su pregunta. http://alturl.com/f5g3c

Patrick Hall

PredictionIO es una buena.

Mario Mantero

More Interesting

Cómo prepararse para un curso de Big Data Analytics en la extensión de Harvard

¿Ganar una competencia de Kaggle es importante fuera de Kaggle?

Al seguir una carrera en ciencia de datos, ¿un doctorado en economía sería más beneficioso que una maestría en ciencia de datos?

¿Qué son las pruebas de Big Data y un ejemplo de ello?

¿Cuál es el significado del procesamiento de datos?

¿Cuáles son algunos buenos problemas con los juguetes (un solo codificador puede hacer durante un fin de semana) en ciencia de datos? Estoy estudiando el aprendizaje automático y las estadísticas, y estoy buscando algo socialmente relevante utilizando conjuntos de datos / API disponibles públicamente.

¿Qué acciones técnicas y contractuales puede tomar el gerente de proyecto en caso de corrupción de datos durante la migración de datos?

¿Cómo se toman los estados de Facebook o Tweets, que están escritos en un idioma mixto, en el análisis de sentimientos?

¿Cuánto tiempo lleva limpiar los datos con R para un analista de datos?

¿Cuál es la diferencia entre MongoDB y big data?

¿Qué tan útil es Matlab, para Kaggle, en comparación con R y Python?

¿Cuál es la diferencia entre ciencia de datos, aprendizaje automático e inteligencia artificial?

Cómo pasar mi carrera de consultor MDM al análisis de datos

¿Soy solo yo, o es 'ciencia de datos' el peor nombre para un campo?

¿Cuáles son los ejemplos cuando Data Science se utilizó o se utiliza para proteger o cuidar el medio ambiente?

Web Analytics