¿Cuáles son los beneficios de la remodelación de datos?

Mi suposición es que estás hablando de remodelar datos largos a datos anchos , o viceversa. Si no, por favor, explique lo que quiere decir con remodelación.

Ejemplo

Supongamos que tenemos el siguiente conjunto de datos de ejemplo (tomado del manual de Stata). Tenemos un número de identificación (id), género (sexo) y tres observaciones de ingresos por persona, a saber, los ingresos en el año ’80, ’81 y ’82.

Una versión amplia de los datos se ve así:

Una versión larga de los mismos datos se ve así:

Notas:

  1. Si necesita largo o ancho depende de su software. Algunos procedimientos estadísticos quieren datos largos, otros quieren datos amplios. El beneficio de la remodelación reside principalmente en poder convertir los datos al formato deseado.
  2. El formato largo generalmente ocupa más espacio. Como puede ver, el formato largo tiene más datos (aunque duplicados). Para grandes conjuntos de datos, el uso de un formato ancho a veces podría ser más práctico.
  3. El formato largo es más flexible. Desde una perspectiva de base de datos, el formato ancho tiene una clara desventaja. Muy a menudo, la estructura de una base de datos ( es decir, las columnas) es fija. ¿Qué pasa si desea agregar otro año de datos de ingresos? En el formato largo , simplemente agregaría filas. En el formato ancho, necesitaría cambiar la estructura de la base de datos. Si su estructura de datos es fija, un formato largo puede ser la única opción.