Cómo predecir las ventas del próximo año, nivel de día, dada la información de ventas de años anteriores, también a nivel de día, y mediante el uso de Kalman Filtering

No sé mucho sobre finanzas, pero tengo una buena experiencia en procesamiento de señales y filtrado de Kalman de cursos y lectura de literatura sobre robótica. También tengo experiencia en análisis de datos.

No estoy realmente seguro de qué nivel de día es, pero la primera pregunta que haría es si sabes qué es un filtro de Kalman.

Un tratamiento realmente excelente del filtro de Kalman y el trasfondo matemático se encuentra en el libro Probabilistic Robotics de Sebastian Thrun. Su aplicación es obviamente robótica, pero puede extenderse a otras aplicaciones.

Aquí hay algo que busqué en Google también, y se ve bastante decente después de una descremada:

El filtro de Kalman para series de tiempo financieras

Un filtro de Kalman es realmente útil cuando necesita estimar el estado de algo, pero no puede medirlo directamente. Que yo sepa, generalmente se usa para estimar algo que cambia de estado con el tiempo. Por lo tanto, su estructura es un modelo oculto de Markov. Por lo tanto, es útil en robótica porque un robot debe medir indirectamente su entorno con sensores, por lo que su visión del mundo siempre es ruidosa.

Un filtro de Kalman también tiene una serie de supuestos (variables aleatorias gaussianas, linealidad, supuestos de Markov, etc.) que debe tener en cuenta.

No estoy seguro de si es aplicable a su objetivo de predecir ventas en el próximo año según la información de ventas anterior. Eso suena como una tarea que podría lograrse mediante algo como la regresión lineal. Existen potentes herramientas estadísticas que puede utilizar para verificar la precisión de su modelo estadístico, incluso si no tiene miles de puntos de datos, y puede tener en cuenta múltiples características (precio, clima, etc.). Un gran recurso es una introducción al aprendizaje estadístico por Hastie et. Alabama.

¡Espero que esto haya ayudado a algunos!

Un filtro de Kalman (KF) en realidad sería un modelo bastante pobre para hacer este tipo de predicción, principalmente porque las ventas anuales tienden a tener fuertes tendencias a nivel de día y temporada a las que un KF sería insensible. Los KF funcionan mejor cuando no sabes nada sobre la variable subyacente que estás rastreando, aparte de que no salta demasiado de vez en cuando t + 1.

Si bien este tipo de continuidad puede mantenerse en sus series de tiempo de ventas, los elementos más interesantes de este conjunto de datos probablemente sean las tendencias estacionales y semanales (¿más compras en otoño que en invierno? ¿Más compras a principios de semana que más tarde?), Lo que sugiere que un análisis de regresión sensible a múltiples escalas de tiempo serviría mejor a su propósito.

El enfoque más simple que viene a la mente es una regresión del Proceso Gaussiano. Vea el Capítulo 2 en el libro de Rasmussen & Williams sobre Procesos Gaussianos para un ejemplo detallado.