Mi suposición es que estás hablando de remodelar datos largos a datos anchos , o viceversa. Si no, por favor, explique lo que quiere decir con remodelación.
Ejemplo
Supongamos que tenemos el siguiente conjunto de datos de ejemplo (tomado del manual de Stata). Tenemos un número de identificación (id), género (sexo) y tres observaciones de ingresos por persona, a saber, los ingresos en el año ’80, ’81 y ’82.
- ¿Qué será mejor para un empleado de TI con experiencia de 3 años, para seguir un curso a tiempo completo o un curso a tiempo parcial en Data Science?
- ¿Cuáles son ejemplos de datos secundarios?
- Soy un recién graduado en ingeniería industrial, ¿cómo comienzo mi camino en ciencia de datos para la cadena de suministro?
- ¿Quiénes son los mejores expertos en aprendizaje automático (ML)?
- ¿Cuáles son los pros y los contras de usar Kaggle Scripts?
Una versión amplia de los datos se ve así:
Una versión larga de los mismos datos se ve así:
Notas:
- Si necesita largo o ancho depende de su software. Algunos procedimientos estadísticos quieren datos largos, otros quieren datos amplios. El beneficio de la remodelación reside principalmente en poder convertir los datos al formato deseado.
- El formato largo generalmente ocupa más espacio. Como puede ver, el formato largo tiene más datos (aunque duplicados). Para grandes conjuntos de datos, el uso de un formato ancho a veces podría ser más práctico.
- El formato largo es más flexible. Desde una perspectiva de base de datos, el formato ancho tiene una clara desventaja. Muy a menudo, la estructura de una base de datos ( es decir, las columnas) es fija. ¿Qué pasa si desea agregar otro año de datos de ingresos? En el formato largo , simplemente agregaría filas. En el formato ancho, necesitaría cambiar la estructura de la base de datos. Si su estructura de datos es fija, un formato largo puede ser la única opción.