¿Cuál es el proceso para realizar algunos proyectos pequeños en componentes de big data?

Gracias por el A2A. Como ya se ha dicho, no hay nada que le impida descargar todos los componentes y herramientas necesarios a su alrededor.

Descargue la VM de inicio rápido de Cloudera para configurar rápidamente un clúster Hadoop de un solo nodo con todos los paquetes que menciona. Si aún no tiene un software de virtualización en su máquina, puede descargar Virtual Box de forma gratuita. Se ejecuta en Windows, Linux y OS X.

Una vez que haya creado el entorno virtual, puede comenzar a jugar con él. Consulte la página de Data Science Central sobre conjuntos de datos de Big Data disponibles de forma gratuita.

También puede consultar KDNuggets para conjuntos de datos o tutoriales o dirigirse a Kaggle para obtener más conjuntos de datos y competencias de ciencia de datos.

Si le gusta un enfoque más estructurado y es completamente nuevo en la ecosfera de Big Data, le recomiendo la Especialización en Big Data de UC San Diego en Coursera. Cubre las bases de datos Spark, Hive, Pig, Hadoop, Graph y más. Es fácil de seguir y proporciona conocimientos teóricos y prácticos (prácticos).

Apache HadoopApache SparkBig DataBig Data AnalysisData AnalysisData ScienceMachine Learning

Related Content

¿Cuáles son los casos de uso de Docker en Data Science y Machine Learning?

¿Data Camp es bueno para aprender R y Python?

¿Existe una guía de inicio automático para PNL?

¿Quién es el ganador del desafío ImageNet LSVRC-2016? ¿Cuál es su enfoque?

¿Cuál es la más fácil: aprendizaje automático, inteligencia artificial o ciencia de datos?

¿Cuáles son las alternativas a los cursos como Big Data?

¿En cuántas dimensiones (Vs) se define comúnmente Big Data?

no hay nada que le impida instalar estas herramientas que mencionó en su propia computadora de desarrollo de un solo nodo y comenzar a experimentar y desarrollarlas. De hecho, es lo que hacen muchos desarrolladores cuando desarrollan su solución de big data antes de pasar al clúster real.

Eric Carr

More Interesting

MATLAB: ¿Cómo utilizan realmente las compañías el código generado por Matlab / Statistica en la producción?

En minería de datos, ¿cómo extraigo los valores monetarios del texto del cupón OCR?

¿Qué es la ciencia de datos? ¿Cuál es el alcance? ¿El análisis de datos y el análisis comercial son lo mismo? ¿Necesitamos estudiar programación?

En la regresión logística, ¿cómo encuentra el mejor límite de decisión posible algorítmicamente?

¿Cuáles son los principales factores del big data?

¿Qué tan relevante es el análisis de Big Data para la economía global actual?

¿Por qué es importante la minería de datos?

¿Cuáles son algunas de las principales conferencias de ciencia de datos y análisis en India?

¿Cómo difiere la ciencia de datos en el sector público del sector privado? ¿Qué servicios del sector público podrían beneficiarse de la ciencia de datos?

Cómo aprender Python con respecto al desarrollo de Big Data

Cómo ingresar a la genómica o la biología computacional como científico de datos

¿Es Data Science un futuro mejor que Java?

¿El aumento de Big Data obstaculizará el progreso de la investigación matemática?

Cómo demostrar que los grandes datos son valiosos para las empresas

¿Cuál es el mejor método matemáticamente sólido para crear una tasa ponderada de participación en Facebook?

Web Analytics