¿Dónde puedo encontrar datos para practicar la ciencia de datos?

Junto con la tecnología relativamente nueva de Big Data está el nuevo científico de datos de títulos de trabajo. Si bien no está vinculado exclusivamente a los proyectos de Big Data, el rol del científico de datos los complementa debido a la mayor amplitud y profundidad de los datos que se examinan, en comparación con los roles tradicionales … Puede visitar este enlace: Científico de Big Data Un científico de datos representa una evolución desde el rol de negocio o analista de datos. La capacitación formal es similar, con una base sólida típicamente en ciencias de la computación y aplicaciones, modelado, estadística, análisis y matemático científico de datos, además de una gran perspicacia comercial, junto con la capacidad de comunicar los resultados a los líderes empresariales y de TI de una manera que pueda influir en cómo una organización aborda un desafío empresarial. Los buenos científicos de datos no solo abordarán los problemas comerciales, sino que elegirán los problemas correctos que tengan el mayor valor para la organización.

El rol del científico de datos ha sido descrito como “analista en parte, artista en parte”. Un científico de datos es alguien que es inquisitivo, que puede observar los datos y detectar tendencias. Es casi como un individuo del Renacimiento que realmente quiere aprender y aportar cambios a una organización “.

Mientras que un analista de datos tradicional puede mirar solo los datos de una sola fuente, por ejemplo, un sistema CRM, un científico de datos probablemente explorará y examinará datos de múltiples fuentes dispares. El científico de datos examinará todos los datos entrantes con el objetivo de descubrir una información previamente oculta, que a su vez puede proporcionar una ventaja competitiva o abordar un problema empresarial urgente. Un científico de datos no solo recopila e informa sobre los datos, sino que también los mira desde muchos ángulos, determina lo que significa y luego recomienda formas de aplicar los datos.

Aquí hay una lista de sitios web donde puede encontrar los datos que está buscando:

Comience primero con Google Public Data Explorer

Gobierno y ONG

Data.gov

Oficina del Censo de EE.UU

El Banco Mundial

Eurostat

Laboratorio de datos de la OCDE

UNICEF

Clima

WeatherBase

Centro Nacional de Datos Climáticos

Deportes

Referencia de baloncesto

Baseball DataBank

base de datosFútbol

Aquí lista de datos públicos:

  • Data.gov
  • Su hogar para la ciencia de datos
  • Grupo de datos públicos
  • 476 millones de tweets de Twitter datos de Twitter
  • Ciudad de Chicago | Portal de datos
  • NYC Open Data.

Espero que ayude 🙂

El sitio más popular para los conjuntos de datos listos para sumergirse es: UCI Machine Learning Repository

Explore Quandl en Quandl Financial and Economic Data

En Kaggle

Hay muchas fuentes de internet disponibles. Solo google, “repositorios de datos”.