Los datos son valiosos y las personas no los regalan. Las empresas privadas mantienen sus datos privados. El gobierno recopila datos médicos e ingresos, pero estos datos son confidenciales y necesita un permiso especial para usarlos. En general, no solo obtiene los datos que desea para sus propios fines, sino que debe trabajar para la organización propietaria de los datos o estar en un acuerdo de uso de datos para responder las preguntas que el propietario de los datos desea que usted haga (no sus propias preguntas) Violar la seguridad de los datos para sus propios fines es un delito penal.
Muchas carreras académicas de investigación no se basan en habilidades analíticas, sino en acceso exclusivo a un conjunto de datos particularmente valioso.
Para un principiante, solo comience con los conjuntos de datos de juguetes incluidos con el idioma. Entonces, tal vez pasar a conjuntos de datos de investigación pública, como el NLSY, el CPS o el HRS de Michigan, que son gratuitos. No vas a descubrir nada que la gente aún no sepa, pero en esta etapa solo necesitas practicar.
- ¿Cómo trato con los datos faltantes cuando ejecuto una regresión logística?
- Cómo elegir un modelo ML cuando el objetivo es tanto una predicción razonable como una inferencia
- ¿Existe alguna buena información para el aprendizaje automático de pronóstico de demanda de capacitación? Estoy buscando datos de ventas de series temporales con muchos atributos.
- ¿Puedo aprender Hadoop sin conocimiento previo del análisis de datos?
- ¿Por qué Sebastian Raschka no termina su doctorado?