Hola,
Permítanme intentar responder esta pregunta a mi entender. El paso DATOS le proporciona dos funciones, LAG y DIF, para acceder a valores anteriores de una variable o expresión. Estas funciones son útiles para calcular retrasos y diferencias de series.
Cuando se usa de manera simple, LAG y DIF actúan como funciones de retraso y diferencia. Sin embargo, es importante tener en cuenta que, a pesar de sus nombres, las funciones LAG y DIF disponibles en el paso DATOS no son verdaderas funciones de retraso y diferencia.
- ¿Hay un umbral de tamaño sobre el cual los datos se convierten en grandes datos?
- Si escribo una disertación sobre el impacto de Big Data en una industria específica, ¿necesito aprender Análisis de datos?
- ¿Existe algún beneficio de saber que Java debe seguir el camino de ser un científico de datos o puede tomarse como un complemento? (Java-as Map reduce los requisitos previos: análisis de Big Data)
- ¿Cómo comparar los algoritmos de clasificación de minería de datos? ¿Hay algún parámetro / punto de referencia para ello?
- Después de la ingeniería, ¿cuál es mejor, capacitación en ciencias de datos o un curso de diploma de ciencias de datos PG?
Por el contrario, LAG y DIF son funciones de cola que recuerdan y devuelven valores de argumentos de llamadas anteriores. La función LAG recuerda el valor que le pasó y devuelve como resultado el valor que le pasó en la llamada anterior. La función DIF funciona de la misma manera pero devuelve la diferencia entre el argumento actual y el valor recordado. (LAG y DIF devuelven un valor faltante la primera vez que se llama a la función).
Una verdadera función de retraso no devuelve el valor del argumento para la “llamada anterior”, como lo hacen las funciones LAG y DIF del paso DATA. En cambio, una verdadera función de retraso devuelve el valor de su argumento para la “observación previa”, independientemente de la secuencia de llamadas anteriores a la función. Por lo tanto, para que una verdadera función de retraso sea posible, debe quedar claro cuál es la “observación previa”.
Si los datos se ordenan cronológicamente, entonces LAG y DIF actúan como funciones de diferencia y retraso real. En caso de duda, use PROC SORT para clasificar sus datos antes de usar los LAG y DIF. Tenga cuidado con las observaciones faltantes, que pueden hacer que LAG y DIF devuelvan valores que no son los valores de diferencia y retardo reales
El paso DATA es una herramienta poderosa que puede leer cualquier cantidad de observaciones de cualquier cantidad de archivos de entrada o conjuntos de datos, puede crear cualquier cantidad de conjuntos de datos de salida y puede escribir cualquier cantidad de observaciones de salida en cualquiera de los conjuntos de datos de salida, todo en el mismo programa Por lo tanto, en general, no está claro qué significa “observación previa” en un programa de pasos DATA. En un programa de pasos DATA, la “observación previa” existe solo si escribe el programa de una manera simple que haga que este concepto sea significativo.
Dado que, en general, la observación anterior no está claramente definida, no es posible realizar funciones de diferencia o retraso real para el paso DATOS. En cambio, el paso DATOS proporciona funciones de cola que facilitan el cálculo de retrasos y diferencias.
espero que esta respuesta ayude