¿Son los métodos de aprendizaje automático una especie de interpolación, mientras que los métodos de series temporales actúan como métodos de extrapolación?

En comparación con las otras herramientas estadísticas que ahora se denominan técnicas de aprendizaje automático, las series de tiempo son más difíciles, en general, de acertar.

Sin embargo, si usamos la definición bastante flexible de aprendizaje automático que parece ser aceptada hoy en día, los modelos de series temporales son definitivamente aprendizaje automático. Si bien a veces es difícil ver si, para un problema particular de clasificación o regresión, si estamos extrapolando o interpolando, cuando tratamos específicamente con datos de series de tiempo, sabemos que al pronosticar podemos muy bien estar extrapolando. Estamos tratando de predecir el futuro y, por lo tanto, somos conscientes de que algo puede cambiar.

La extrapolación es un juego peligroso, que, siendo entrenado estadísticamente, siempre trato de hacerlo con mucho cuidado. Sin embargo, me siento más cómodo prediciendo datos de series de tiempo donde entiendo el proceso en una tarea de clasificación grande que solo he visto brevemente. En el primero, puedo estar mucho más seguro de que no estoy extrapolando. Nunca completamente seguro, pero más aún.

La extrapolación está saliendo del espacio de datos en el que el modelo o algoritmo aprendió. Si bien el futuro siempre es incierto, al comprender el proceso que genera la serie temporal, podemos ver si es probable que se mantenga así o no. Podríamos estar equivocados, por supuesto, pero con suficientes datos y pensamiento, podemos ver si es una suposición razonable. Esto es difícil de automatizar bien, y es obvio desde el principio.

He visto fallar los modelos automatizados de aprendizaje automático porque la implementación no tuvo en cuenta la posibilidad de que los datos estén muy lejos del espacio original aprendido.

Si bien es tentador simplificar o formular hipótesis de esta manera, tenga en cuenta que los métodos de aprendizaje automático abarcan la clasificación y la regresión y que las características de estos modelos a menudo pueden ser características que no son del dominio del tiempo. Entonces, cuando intentas comparar una implementación de aprendizaje automático (regresión) con una implementación de pronóstico (o modelado) de series de tiempo, estás comparando manzanas con naranjas.

More Interesting

¿Cuál es mejor, el modelo de regresión o ecuación estructural, y por qué?

¿Cuáles son los posibles remedios si está atascado en la comprensión de la parte técnica de un trabajo de investigación de STEM?

¿Qué es una transformación de características en el aprendizaje automático?

¿Puedo usar el concepto de aprendizaje automático para predecir cuánta cantidad de comida cocinar por día en un restaurante?

¿Qué tan efectivamente se pueden usar las redes neuronales en la regresión? ¿Es posible alguna configuración que prediga un número que no se ve en los datos de entrenamiento?

¿Se puede utilizar la investigación en aprendizaje automático para complementar la epistemología?

¿Qué son los algoritmos recurrentes de redes neuronales?

¿Cuál es el número mínimo de árboles que debo usar en un bosque aleatorio?

Entre la agrupación y la clasificación, ¿cuál requiere más experiencia?

¿Cuál sería el mejor desafío de Kaggle para mí como entusiasta del aprendizaje automático de nivel intermedio?

¿Se moverá el conjunto de problemas ICPC para incluir sistemas distribuidos y aprendizaje automático en el futuro?

En los campos de redes neuronales o aprendizaje profundo, ¿qué es un "gráfico computacional"?

¿Qué significa esto exactamente: 'Hay dos estrategias principales para el reconocimiento facial: comparación de características y coincidencia de plantillas'?

¿Qué se entiende exactamente por pesos compartidos en una red neuronal convolucional?

¿Qué significa end to end en los métodos de aprendizaje profundo?