Para empezar, creo que el repositorio UCI ML será el mejor lugar para comenzar. De su página acerca de:
El depósito de aprendizaje automático de UCI es una colección de bases de datos, teorías de dominio y generadores de datos que son utilizados por la comunidad de aprendizaje automático para el análisis empírico de algoritmos de aprendizaje automático. El archivo fue creado como un archivo ftp en 1987 por David Aha y otros estudiantes de posgrado en UC Irvine. Desde entonces, ha sido ampliamente utilizado por estudiantes, educadores e investigadores de todo el mundo como fuente principal de conjuntos de datos de aprendizaje automático. Como una indicación del impacto del archivo, ha sido citado más de 1000 veces, convirtiéndolo en uno de los 100 “trabajos” más citados en toda la informática.
Para conjuntos de datos más desafiantes, como Anmol Hans prescribió en su respuesta, Kaggle será una buena opción.
- ¿Cuáles son las similitudes y diferencias entre los campos aleatorios condicionales (CRF) y las redes de Markov de margen máximo (M3N)?
- Cómo interpretar una capa totalmente conectada como una capa convolucional para hacer predicciones densas de píxeles
- ¿Cuál es la mejor manera de implementar un SVM usando Hadoop?
- ¿Qué es más poderoso, la red neuronal convolucional o la red artificial? ¿Cuál es más conveniente de usar?
- ¿Hay alguna universidad en la India que ofrezca cursos a corto plazo sobre aprendizaje automático / ciencia de datos?