Como dijo Magnificent Beast, Github es para almacenar y colaborar en código, por lo que no estoy seguro de lo que quieres decir con “usar Github” para aprender y probar tecnologías de Big Data. Dicho esto, aquí hay algunas maneras en que podría hacer tal cosa:
- Analice los datos de GitHub : puede descargar algunos fragmentos bastante grandes de la línea de tiempo pública de eventos en Github del proyecto The GHTorrent. Con 6.5TB de filas JSON / 600m MySQL, esta es una cantidad que es difícil / costosa (aunque no imposible) para caber en una máquina, lo cual es una heurística que uso a menudo para determinar si un conjunto de datos se consideraría “grande”. Ciertamente, lo desafiará a encontrar una forma técnica (base de datos distribuida / reducción de mapas) o estadística (muestreo de manera inteligente) para hacer que el análisis se ejecute en una cantidad práctica de tiempo.
- Tome una clase alojada en GitHub : puede echar un vistazo al Open Source Data Science Masters (https://github.com/datasciencema…), (una compilación de recursos útiles para aprender los muchos aspectos de la ciencia de datos), o Bayesian Methods for Hackers, un curso de Python alojado de forma gratuita (https://github.com/CamDavidsonPi…).
- Use GitHub para trabajar en un proyecto con un amigo : encuentre un amigo, elija un problema al que desee abordar utilizando datos y use Github para mantener su código sincronizado, realizar un seguimiento de todos en la sección Problemas y realizar revisiones de código usando pull peticiones. Aún mejor si el amigo es alguien con experiencia, que puede ayudarlo a evitar las minas analíticas y evitar que se despegue cuando sus guiones no se comporten.
Espero que esto ayude.
- ¿Cuál es la plataforma gratuita de big data que puede admitir la transmisión de datos en tiempo real?
- ¿Cuáles son las válvulas de big data?
- ¿Qué es big data, análisis de negocios, análisis de datos y cómo uno puede convertirse en analista de datos o científico de datos? ¿Hay algún curso a corto plazo?
- ¿Por qué Sebastian Raschka no termina su doctorado?
- Cómo diseñar un clasificador SOM