Hay muchas fuentes diferentes para aprender Big Data.
Sin embargo, tenga en cuenta que ‘Big Data’ es una palabra de moda que abarca muchas cosas. Básicamente, Big Data se puede definir como el análisis computacional de conjuntos de datos extremadamente grandes para revelar patrones, tendencias y asociaciones . Incluye ciencia de datos , análisis de datos , ingeniería de datos , computación en la nube , pero también aprendizaje automático y aprendizaje profundo.
- ¿Cuál sería un buen problema de recomendación de Kaggle para elegir como un proyecto corto?
- Ciencia de datos: dados los buenos datos estructurados, ¿qué técnica de modelado predictivo se puede implementar en R dentro de una semana?
- ¿Es la velocidad de la luz una restricción para los grandes datos?
- ¿Qué es mejor: una maestría en ciencia de datos en la UCL (Univ. College London) o una maestría en estadística en la Universidad de Boston?
- Cómo aprender ciencia de datos sin conocimientos de matemáticas
Los recursos que debe usar para aprender Análisis de Big Data dependen de cuál sea su nivel actual en estos temas y de si está buscando recursos gratuitos o pagos .
UDACIDAD
Udacity ofrece cursos individuales, así como programas completos. Puede completar la mayoría de ellos de forma gratuita y obtendrá extras (entrenamiento, certificado de nanogrado, soporte para la búsqueda de empleo) si elige la oferta paga. Si no puede ver la lista de cursos en la página de nanodegree (parece que el nanodegree de Data Analyst se ha modificado muy recientemente), simplemente consulte su catálogo. Tienen cursos que van desde matemáticas / estadísticas puras hasta pandas y cursos de MongoDB.
Se puede acceder a los cursos de forma gratuita, puede optar por un Nanodegree por $ 199 / mes y obtener un trabajo o una garantía de reembolso con la fórmula Plus por $ 299 / mes.
- Analista de datos Nanodegree
- Ingeniero de Aprendizaje Automático Nanodegree
DATACAMP
DataCamp es un excelente cursus como complemento de Udacity. Tienen cursos en Python, R, y también están comenzando a publicar cursos de SQL. Cada curso es impartido por un experto de la industria. Obtendrá práctica práctica y profundizará en tecnologías específicas utilizadas para el Análisis de Big Data (Manipulación de marcos de datos, Trazado con matplotlib, etc.). También tienen tutoriales más cortos de publicaciones de blog. Son los autores de la Tabla Periódica de Ciencia de Datos al comienzo de esta publicación (la versión en PDF con hipervínculos está aquí), y también hicieron esta gran infografía sobre cómo convertirse en un Científico de Datos.
Puedes practicar todos los primeros capítulos de todos sus cursos de forma gratuita. No estoy seguro de si todavía lo hacen, pero debe tener acceso completo durante unos días si inicia sesión con este enlace de invitación. Entonces es $ 29 / mes, o $ 25 / mes si elige una suscripción anual (detalles de precios aquí). Tenían un 50% de descuento en ofertas para Black Friday y Navidad, si quieres esperar tanto.
Estos son mis dos recursos principales para aprender, y ya están bastante completos. Sin embargo, hay algunos otros:
Consulta de datos
DataQuest es un recurso increíble. Si DataCamp le enseña cómo usar diferentes tecnologías en detalle, DataQuest le explica cómo aplicarlas para completar el análisis. La forma en que lo veo es así: aprende las habilidades en DataCamp y construye su cartera con DataQuest. Tienen tres caminos: analista de datos, ingeniero de datos y científico de datos). También tienen tutoriales más cortos de publicaciones de blog.
Ofrecen un nivel gratuito con acceso a 22 misiones. El nivel pagado es de $ 29 / mes para la fórmula básica (que da acceso a los proyectos de ruta de Data Analyst para construir su cartera), y $ 49 / mes para el nivel premium (que da acceso a todas las rutas y llamadas en horario de oficina). También tienen una oferta de equipo (detalles de precios aquí)
CLASE COGNITIVA
La clase cognitiva (anteriormente llamada Big Data University) es la iniciativa de IBM sobre el tema. Su catálogo es bastante completo y tienen seis caminos de aprendizaje. Es completamente gratis.
CLUB DE APRENDIZAJE DE CIENCIA DE DATOS
El Data Science Learning Club es una iniciativa de Renee Teate, la increíble dama entre el podcast Becoming A Data Scientist. Esta es una ruta guiada en el viaje de Data Science, y una excelente manera de construir una cartera. Aunque escucho el podcast, aún no he usado el Club, pero planeo hacerlo para pulir mis habilidades y desarrollar mi cartera.
FUENTES ABIERTAS DATOS MAESTROS DE LA CIENCIA
El Open Source Data Science Masters es una pista completa de Data Science creada por Clare Corthell, que reúne recursos gratuitos y de pago para una educación completa sobre el tema (cada tema específico tiene una oferta gratuita, y se recomiendan algunos libros, pero de ninguna manera son obligatorios )
PACKT PUB
Packt Pub es una empresa de publicaciones especializada en libros y videos técnicos. Tienen muchos recursos sobre análisis de datos, gestión de bases de datos, etc. Tienen la gran costumbre de ofrecer un libro al día, pero como publican sobre todo tipo de desarrollo (web, seguridad, IoT, Raspberry Pi …), ganó No siempre estar relacionado con Big Data. Los precios de los libros son precios técnicos regulares, pero también puede optar por una suscripción de $ 29 / mes Mapt que le da acceso a todos los libros y todos los videos, en línea (detalles de precios aquí)
Hay otras plataformas como Asamblea General, y luego tienes las plataformas habituales como Coursera y edX , donde los cursos son gratuitos y pagas un certificado (el curso de Andrew Ng sobre Machine Learning es icónico en el campo, si tu base matemática y estadística es sólido ya). También puedes consultar Udemy , donde encontrarás cursos gratuitos y de pago.
Si desea mejorar su conocimiento de matemáticas y estadísticas, definitivamente debe considerar la pista de matemáticas de la Academia Khan de Salman Khan, que es increíble. Para las estadísticas, también puede consultar OpenIntro Statistics y OnlineStatBook (la versión de iBook es increíble). Todos son gratis.
Los blogs y publicaciones en línea como KDnuggets o Data Science Central también son una buena fuente de tutoriales.
Si desea tutoriales y hojas de referencia regulares sobre este tema y recursos generales de Ciencia de datos, Aprendizaje automático e Inteligencia artificial, también puede seguir la cuenta de Twitter de Captain Data.
Luego tiene otras opciones más costosas: se ofrecen muchos bootcamps que puede seguir en línea si puede / desea pagarlos, así como títulos de universidades que puede completar en línea. No he usado ninguno, así que no puedo dar comentarios valiosos sobre eso, pero una búsqueda rápida en Google responderá cualquier pregunta que pueda tener sobre este tema.
Espero que esto ayude. Probablemente editaré esta respuesta si pienso en / recordar / descubrir otras fuentes en el futuro.