¿Cuál es la mejor tecnología para procesar big data además de Hadoop y Spark?

Debería expresar con más precisión qué piensa con el término tecnología. Cuando se refiere a Hadoop, considera un conjunto de tecnologías que abarcan el sistema de archivos, la base de datos y el software de procesamiento. En el mostrador, Spark es un modelo de procesamiento que puede ejecutarse en Hadoop o solo.

Si se refiere (como supongo) a modelos de procesamiento (y en este caso cuando nombra a Hadoop, probablemente se refiera a MapReduce), todavía depende de qué espera de sus datos y qué tipo de análisis desea ejecutar. Si necesita un motor de transmisión, puede consultar Apache Storm. Si quieres un procesador gráfico, Apache Giraph es un buen ejemplo. Si necesita algo de aprendizaje automático, consulte H2O o Apache Mahout.

En el mostrador, si incluso supera el universo Hadoop y Spark, otra solución que nombraría son las tecnologías NewSQL, impulsadas por un procesamiento paralelo masivo (MPP). Sin embargo, tienen un propósito muy diferente (análisis de datos principalmente estructurados).

SAS HPA
SAS / Acceso a Hadoop
Servidor SAS LASR
SAS Data Loader para Hadoop

(Trabajo en algunos de estos productos)

Existen muchas tecnologías para procesar Big Data además de Hadoop y Spark, hay varias otras tecnologías como Pentaho, Tableau, Jaspersoft, Datascience, Casandra y muchas otras. Para profundizar en las tecnologías, revise la siguiente tinta. Podrá obtener un concepto claro para su pregunta. http://alturl.com/f5g3c

PredictionIO es una buena.

More Interesting

Cómo prepararse para un curso de Big Data Analytics en la extensión de Harvard

¿Ganar una competencia de Kaggle es importante fuera de Kaggle?

Al seguir una carrera en ciencia de datos, ¿un doctorado en economía sería más beneficioso que una maestría en ciencia de datos?

¿Qué son las pruebas de Big Data y un ejemplo de ello?

¿Cuál es el significado del procesamiento de datos?

¿Cuáles son algunos buenos problemas con los juguetes (un solo codificador puede hacer durante un fin de semana) en ciencia de datos? Estoy estudiando el aprendizaje automático y las estadísticas, y estoy buscando algo socialmente relevante utilizando conjuntos de datos / API disponibles públicamente.

¿Qué acciones técnicas y contractuales puede tomar el gerente de proyecto en caso de corrupción de datos durante la migración de datos?

¿Cómo se toman los estados de Facebook o Tweets, que están escritos en un idioma mixto, en el análisis de sentimientos?

¿Cuánto tiempo lleva limpiar los datos con R para un analista de datos?

¿Cuál es la diferencia entre MongoDB y big data?

¿Qué tan útil es Matlab, para Kaggle, en comparación con R y Python?

¿Cuál es la diferencia entre ciencia de datos, aprendizaje automático e inteligencia artificial?

Cómo pasar mi carrera de consultor MDM al análisis de datos

¿Soy solo yo, o es 'ciencia de datos' el peor nombre para un campo?

¿Cuáles son los ejemplos cuando Data Science se utilizó o se utiliza para proteger o cuidar el medio ambiente?