¿Dónde puedo encontrar conjuntos de datos abiertos gratuitos para ganar experiencia como Business Intelligence y Data analyst?

De acuerdo con Mis fuentes de datos públicas favoritas: Aspectos destacados de Analytics Industry “Aquí hay muchísimas más fuentes de datos para explorar sin mi argumento de venta superior. ¡Disfrutar!”

Mundo

  • El Banco Mundial http://www.worldbank.org/
  • Gapminder http://www.gapminder.org/data/
  • Conjuntos de datos de las Naciones Unidas http://data.un.org/
  • Fondo Monetario Internacional http://www.imf.org/external/data…
  • Gastos Abiertos https://openspending.org/
  • CIA World Factbook https://www.cia.gov/library/publ…
  • Datos meteorológicos y climáticos de NOAA / NCEI http://www.ncdc.noaa.gov/

Gobierno

  • Data.gov http://www.data.gov/
  • Investigación Económica de la Reserva Federal https://research.stlouisfed.org/…
  • Datos de estadísticas federales de EE. UU. Http://fedstats.sites.usa.gov/da…
  • Oficina de Estadísticas Laborales de EE. UU. Http://www.bls.gov/
  • Gastos de la Agencia Federal de EE. UU. Https://www.usaspending.gov/
  • Administración de Información de Energía de EE. UU. Http://www.eia.gov/
  • Datos de la Oficina del Censo de los EE. UU. Http://www.census.gov/
  • Departamento de Salud y Servicios Humanos de EE. UU. Https://www.healthdata.gov/
  • Departamento de Educación de los Estados Unidos http://www2.ed.gov/
  • OSCAR data.gov.uk https://data.gov.uk/dataset/oscar
  • Portal de datos abiertos de la Unión Europea http://open-data.europa.eu/en/data/
  • Estadísticas europeas de Eurostat http://ec.europa.eu/eurostat/dat…

Minería de datos

  • Lista de juegos de minería de datos de UC Irvine Machine Learning
  • Lista de KD Nuggets de conjuntos de minería de datos
  • Lista BigML de conjuntos de minería de datos

Misceláneas y más listas

  • Datos de muestra públicos de Tableau https://public.tableau.com/en-us…
  • Datos públicos de Amazon Web Services http://aws.amazon.com/datasets
  • Datos públicos de Google https://www.google.com/publicdat…
  • Google Trends http://www.google.com/trends/exp…
  • Freebase People, Places, and Things http://www.freebase.com/
  • Datahub 10K + colección de conjuntos de datos https://datahub.io/
  • Conjuntos de datos públicos de Github https://github.com/caesar0301/aw…
  • Million Song Data Set http://aws.amazon.com/datasets/6…
  • ESPN Sports API http://espn.go.com/apis/devcenter/
  • Datos de referencia deportiva http://www.sports-reference.com/

Los mejores sitios web para conjuntos de datos de código abierto son:

Kaggle: tu hogar para la ciencia de datos

KD Nuggets: análisis, minería de datos y ciencia de datos

Si desea aprender más que solo el aprendizaje automático, vaya a:

Amazon AWS – Amazon Web Services (AWS) – Servicios de computación en la nube

Github: cree mejor el software juntos

Si quieres aprender a usar BigQuery:

Conjuntos de datos en la nube de Google: Google Cloud Computing, servicios de alojamiento y API | Google Cloud Platform

Reddit – Conjuntos de datos • r / conjuntos de datos La gente publica aquí todo el tiempo. Sin embargo, este debería ser su último recurso, a menos que esté buscando datos no estructurados.

  • Conjuntos de datos públicos impresionantes de GitHub
  • Conjuntos de datos del repositorio de aprendizaje automático de UCI
  • Conjuntos de datos de Kaggle [no públicos]

More Interesting

¿De qué manera el big data y el aprendizaje automático cambiarán el mundo de los restaurantes?

¿Cómo mejorar mi perfil para obtener una admisión para MS en Data Science de GA TECH?

¿Qué es mejor para analizar datos de redes sociales: almacén de datos o una solución de big data?

¿Hay alguna plataforma que genere automáticamente informes de información para los usuarios a partir de una tabla de estadísticas?

¿En qué se diferencia el algoritmo vecino k-más cercano de la agrupación k-means?

¿Cuáles son algunos problemas de ciencia de datos que deben resolverse?

Estoy planeando obtener la admisión para MS Data Science. ¿Alguien puede sugerirme las mejores universidades en las que pueda ingresar y tener buenos aspectos futuros?

¿Vale la pena hacer ciencia de datos en una certificación R de DataCamp?

¿Qué se necesita para clasificar dentro del # 10 en Kaggle? ¿Cuál es el camino de aprendizaje ideal para un principiante en ciencia de datos? ¿Qué todas las tecnologías y habilidades necesita adquirir y en qué orden? ¿Cuánto tiempo se tarda?

Quiere aprender Big data. ¿Cómo debo aprender desde una perspectiva de prueba, por favor responda?

¿Cuál es la mejor manera de ganar mucho dinero en menos tiempo?

Cómo aterrizar en un trabajo de análisis y ciencia de datos en India

¿Qué tipo de pruebas estadísticas se pueden realizar en modelos estadísticos versus conjuntos de datos?

¿Qué análisis se puede hacer en los datos de asistencia de los empleados?

¿Por qué, en su opinión, tantas compañías de investigación clínica se niegan a usar Python en lugar de SAS o R?