¿Cuáles son algunos buenos proyectos iniciales para alguien que está aprendiendo ciencia de datos por sí mismo?

Como Sai Prabhanjan Reddy ha mencionado, puede comenzar con The Home of Data Science. Solo para agregar más contexto, puedo decirte cómo me va con el aprendizaje de los conceptos. Entre R y Python, elegí Python porque ya tenía experiencia en desarrollo y es muy fácil de usar. Empecé aquí Aprender ciencia de datos en línea y completé el curso básico para aprender Pandas. Pandas es una biblioteca utilizada para manejar datos similares a Excel y para limpiar los datos. Más tarde comencé con scikit-learn desde aquí scikit-learn: aprendizaje automático en Python. Ya tenía cursos de aprendizaje automático durante mi universidad. Pero puede tomar cualquier curso de aprendizaje automático de Course / edX / Udacity para obtener los conceptos básicos.

Una vez que tenga una idea de los conceptos básicos, puede comenzar a usar diferentes algoritmos de scikit-learn como SVM, árboles de decisión para tener una idea sobre qué algoritmos son los más adecuados para cada problema. Luego puede estudiar sobre embolsado y refuerzo para aumentar la precisión de la predicción. A partir de aquí, puedes aprender todo lo que te interese en redes neuronales, aprendizaje profundo, etc. Participa en competiciones de Kaggle y hazte la prueba. Ir a través de los foros de kaggle para obtener conocimiento. Kaggle ofrece una opción para ver otras secuencias de comandos también donde puede obtener información.

Comience con http://www.kaggle.com . Aquí los proyectos / concursos van desde el modo de aprendizaje al modo de competencia con científicos de datos y analistas de todo el mundo.
Es una plataforma bonita y sorprendente para aumentar sus habilidades en ciencia de datos. Lo único sorprendente con kaggle es sus enormes foros donde el conocimiento se intercambia muy bien. Este es un paso inicial que puede tomar si ama el autoaprendizaje.

More Interesting

¿Cuáles son las clases que debo tomar como estudiante universitario de B.Tech para una carrera en Data Science y qué buscan exactamente las empresas durante las prácticas?

¿Necesito aprender el desarrollo del backend si quiero convertirme en un científico de datos?

¿Cuál es el mejor instituto de capacitación en ciencia de datos en Pune?

¿Cuáles son algunos problemas de aprendizaje automático que se resolvieron con soluciones generativas en lugar de soluciones discriminatorias?

¿Cuánta programación debe saber alguien antes de entrar en Machine Learning y Data Science?

¿Puedo comenzar a aprender ciencia de datos y big data a los 34 años o es demasiado tarde?

¿Cuáles son los mejores ejemplos de ciencia de datos aplicados al comercio minorista?

¿Cuál es la relación entre la ciencia de datos y la cadena de bloques (si hay alguna)?

¿Qué tan útil es una participación en competencias de Kaggle para la carrera de ciencia de datos?

¿Es necesario obtener una maestría para trabajar en el área de ciencia de datos, si no tengo experiencia previa? ¿Los reclutadores valoran alguna certificación en ciencia de datos o buscan principalmente una maestría?

¿Cuál es la mejor computadora portátil Big Data?

¿Cómo es trabajar en proyectos de aprendizaje automático en la industria del software?

¿Qué antecedentes aparte de estadísticas y programación (R) necesito para poder manipular y analizar datos espaciales?

¿Qué es más preferible en el aprendizaje automático, la precisión del modelo A es del 50% en los datos de entrenamiento y del 97% en los datos de las pruebas, o el modelo B tiene una precisión del 80% en los datos del tren y el 75% en los datos de las pruebas? (Más detalles en el comentario abajo) gracias!

¿Qué se sigue investigando en bosques aleatorios?