Tu pregunta no está clara. ¿Hay alguna razón en particular para que construyas un conjunto de datos? Si realmente desea construir un conjunto de datos con sus propios atributos y datos, puede hacerlo utilizando una hoja de cálculo.
Si tiene como objetivo la creación de un gran conjunto de datos con miles y miles de filas, tomará una buena cantidad de tiempo, ¡y no es aconsejable!
Hay muchos sitios disponibles donde puede descargar conjuntos de datos
- ¿Cuáles son buenos recursos para aprender sobre la ejecución distribuida en redes neuronales profundas (MPI, allreduce, etc.)?
- ¿Cuál es el impacto de la limitación de la velocidad de la luz en el aprendizaje automático?
- ¿Qué se entiende por agrupamiento jerárquico aglomerativo?
- ¿El apilamiento de modelos en el aprendizaje automático hace una gran diferencia en los resultados?
- ¿Cuál es la mejor técnica de aprendizaje automático para clasificar ~ 50,000 imágenes sin etiquetar (2-3% de ruido) en 3 clases diferentes?
1) Plataforma de datos de gobierno abierto (OGD) India → un sitio para apoyar la Iniciativa de datos abiertos del gobierno de India. GOI ofrece una gran cantidad de conjuntos de datos en tiempo real.
Del mismo modo, tiene los conjuntos de datos disponibles por diferentes gobiernos en varios países.
Data.gov → Datos de EE. UU.
http://datausa.io → La visualización más completa de datos públicos de EE. UU.
Data.gov.sg → Datos en Singapur
etc. Puede buscar en Google los datos de muchos otros países.
2) Puede descargar conjuntos de datos de sitios como Kaggle, Your Home for Data Science, donde se organizan Hackathons
3) Puede descargar datos de universidades como UAH
http://uah.edu/
https://www.nsstc.uah.edu/atmchem/download_data.html
https://en.wikipedia.org/wiki/UAH_satellite_temperature_dataset