Siempre asocié datos primarios con los datos que recopilo yo mismo. Por ejemplo, datos de hogares: es decir, observo un hogar, tengo instrumentos (por ejemplo, cuestionarios) para permitir que los hogares en mi encuesta muestren sus características (tamaño y “composición”, gastos, ingresos, ahorros, etc. ) efectos en el contexto de la vida del hogar, y luego uso los datos que provienen de tantos hogares como datos primarios. Sé que esto no suena científico, pero lo que lo hace primario es que es mi primera persona y todo el equipo responsable de recopilarlo. Por supuesto, no se limita a “recopilarlo”: el equipo necesita un marco, un diseño de muestreo, procedimientos, limpieza, codificación, análisis de tabulación, etc.
Por otro lado, los datos secundarios serían los datos que podría usar, pero otra persona fue responsable de recopilar. Existen restricciones muy grandes para una persona que dice estar usando datos primarios; espero que la persona haya recopilado los datos ella misma.
- ¿Un perfil como el mío tiene alguna posibilidad de ingresar a un buen instituto a través de GRE para obtener una maestría en ciencia de datos?
- ¿Podrían algunas características ser más importantes / significativas en algunos algoritmos de aprendizaje automático que en otros?
- ¿Cuál es la diferencia entre el científico de datos y el científico de investigación en Google?
- ¿Qué se necesita para que un estudiante de matemáticas e informática se convierta en un científico de datos?
- ¿Por qué los científicos usan palabras no rigurosas como "ultra intenso"?