Estamos rodeados, incluso abrumados por los datos que puede utilizar para practicar sus habilidades de análisis de datos.
En política y economía :
- Mire el trabajo realizado por DataKind, en gran parte con datos públicos.
- Mire el Quarterly Journal of Economics y el Journal of Political Economy para ver ejemplos de investigación.
- Echa un vistazo a la excelente colección FRED de la Reserva Federal de St. Louis.
- FiveThirtyEight a menudo utiliza datos públicos para su análisis de encuestas y deportes.
¿Qué tipo de preguntas debes responder? En general, trataría de equilibrar el impacto con la viabilidad, por ejemplo:
- ¿Qué es la agregación y desagregación de datos en Tableau?
- ¿De qué maneras es importante la investigación matemática fundamental en espacios de alta dimensión (por ejemplo, geometría / topología) importante para la ciencia de datos y el aprendizaje automático?
- ¿Cómo hacemos un envío de código en Kaggle?
- ¿Cuál debería elegir, Data Science en UC Berkeley (programa MIDS) por $ 65,000, o Data Science en la Universidad de Illinois (MCS-DS) por $ 20,000?
- Entrevistas de trabajo de análisis de datos: ¿qué puede decir sobre SQL como herramienta para mostrar sus habilidades?
- Política: Predecir resultados geopolíticos y medir la creciente influencia económica y política (ver El Proyecto GDELT).
- Mida la corrupción y su compleja relación con el desarrollo. ¿Necesita medidas de desarrollo? Ver: Unión Europea | Datos
En medicina:
- Hay datos fascinantes sobre el desempeño del médico y del hospital disponibles aquí: Data.Medicare.gov.
- Material de los Centros para el Control y la Prevención de Enfermedades
- Echa un vistazo a Metabase: la base de datos de bases de datos biológicas
¿Qué tipo de preguntas puede hacer con respecto a la medicina? Esto debería ser fácil: ¿cómo influyen la calidad, la ubicación y el gasto del médico y la institución médica en los resultados del paciente? ¿Qué enfermedades, tratamiento y características de las instalaciones están más estrechamente relacionadas con el costo y la gravedad proyectados?
En los negocios :
- Echa un vistazo a Kaggle, Quandl, Enigma, y si eres estudiante de Wharton Research Data Services.
- Explore los datos (actualmente) disponibles para el Desafío del conjunto de datos de Yelp.
- Explore la cobertura de los medios. Muchos medios de comunicación tienen API que puede utilizar, como Times Developer Network – API.
- Para ver la práctica de ingeniería, puede comenzar con la API de GitHub.
- Para ver el capital de riesgo, comience con CrunchBase Data Hub.
- Para ver el crédito al consumidor, comience aquí: datos del Lending Club.
- Echa un vistazo a la revista Administrative Science Quarterly para inspirarte en la investigación empresarial.
Las preguntas en negocios y economía obviamente se centran en predecir el valor y predecir el cambio. Por ejemplo: Raspe los datos de la propiedad y haga un análisis para predecir el valor de la vivienda. O responda: ¿Cuáles son las tendencias en la producción o el consumo de [X], algún producto que le interese?
Otros temas: El depósito de aprendizaje automático de UCI es popular para desarrollar problemas de práctica.
Creo en la importancia de comprender las técnicas de aprendizaje automático para la práctica del análisis de datos, pero si no está interesado en el campo más amplio de la ciencia de datos, comience por dominar la econometría y la validación cruzada. Realmente entiendo los métodos estadísticos y sus implicaciones.
Bien, entonces estás practicando. ¿Que sigue?
- ¡Estudia, estudia, estudia! Por ejemplo: ¿Cuáles son las habilidades más valiosas para aprender para un científico de datos ahora?
- Por supuesto, lee blogs. Aquí está mi último favorito: Algoritmos de transmisión
- ¡Sigue una interesante investigación de análisis de datos! Puede comenzar explorando autores y presentaciones aquí: NIPS Annual Meeting 2015.
- Para obtener más información sobre la arquitectura de datos, ocasionalmente llego en persona a eventos como este: NYC Data Engineering.
- Aprenda múltiples lenguajes de programación y herramientas para ampliar sus habilidades. Vea Code Wars y Seven Languages en Seven Weeks.
El análisis de datos, como aprender un idioma o aprender ingeniería de software, es una odisea. La buena noticia es que puedes hacer un trabajo interesante y valioso mucho antes de lograr el dominio.