¿Puedo usar el aprendizaje automático para pronosticar datos de series temporales para puntos de datos discretos dispersos?

Como dijo Jonathan Tay, puede considerar ARIMAX como una extensión de OLS (no es del todo trivial hacerlo y hay algunas cosas a tener en cuenta al hacerlo).

Contrarrestaría la premisa de la pregunta (bajo el supuesto de que estamos tratando la regresión OLS como una técnica de aprendizaje automático): bajo dicho supuesto, ARIMA y ARIMAX también son técnicas de aprendizaje automático.

El hecho de que sean de naturaleza estadística y tengan supuestos estadísticos no significa que no califican como ML. Si OLS es ML, también lo es la mayoría de las estadísticas. Solo se mira de manera diferente a veces.

Editar: Después de comentar esta respuesta, me di cuenta de que había dejado algo fuera. Mi punto es que si OLS se ve como ML, también debería ARIMA y ARIMAX. La pregunta es si siempre deberían serlo (y la respuesta a menudo es negativa en mi mente), pero esa no es la pregunta bajo investigación.

Algunas cosas "fueron modeladas como procesos de Poisson". ¿Qué quieren decir con eso?

¿Cómo puedo comenzar a construir un motor de recomendación? ¿Dónde puedo encontrar un conjunto de datos interesante? ¿Con qué herramientas / tecnologías / algoritmos es mejor construir el motor? ¿Cómo verifico la efectividad de las recomendaciones?

¿Qué tan importante es Octave como primer paso en Machine Learning? ¿Se utiliza en la industria?

¿Cómo se implementa la funcionalidad de verificación de spam mediante el aprendizaje automático?

Algunas cosas “fueron modeladas como procesos de Poisson”. ¿Qué quieren decir con eso?

En la curva ROC, cualquier punto es resultado del modelo en un parámetro particular. No estoy claro por qué el adivinador aleatorio está en x = y y no siempre (0.5, 0.5). ¿También cómo interpretar el área bajo la curva?

Los modelos de series temporales suelen ajustarse utilizando mínimos cuadrados ordinarios, que es un algoritmo básico de aprendizaje automático. Todo lo que está haciendo ARIMA y ARMA es generar un conjunto específico de características para el modelo de regresión. Es un cambio relativamente trivial cambiar el regresor de OLS a otra cosa.

Arko Bhattacharya

Cuantos más parámetros tenga un modelo, más datos necesitará. Un modelo ARMA (p, q) tiene parámetros p + q, mientras que una red neuronal completamente conectada con n entradas, m neuronas en la capa oculta y una salida tiene n * m + m pesos que deben ajustarse. La conclusión es que los métodos de aprendizaje automático tienden a tener más parámetros y, por lo tanto, necesitan más datos, por lo que no serían adecuados para datos de bajo volumen. Puede hacer esta noción más precisa con medidas como AIC y BIC. [1]

Otra consideración es el conocimiento del dominio. Si tiene mucho conocimiento de dominio para decir, un sistema experto o algunas ecuaciones lógicas difusas, eso podría compensar los escasos datos de entrada, de modo que el aprendizaje automático arroje mejores resultados que las estadísticas ordinarias.

[1] http://en.wikipedia.org/wiki/Aka …

Arko Bhattacharya

More Interesting

¿Qué se entiende por agrupamiento jerárquico aglomerativo?

Cómo elegir el mejor kit de desarrollador de sistemas integrados para el proyecto My Image Processing y Machine Learning

¿NVIDIA GTX 1050 Ti 4GB es suficiente para Deep Learning?

¿Cuáles son algunos de los mejores algoritmos de aprendizaje automático, considerando la eficiencia, la facilidad de implementación, etc.?

¿Por qué las celdas LSTM tienen dos puertas de escritura?

Cómo encontrar el siguiente número de la lista de números anteriores usando el aprendizaje profundo

Cómo depurar sus proyectos de ciencia de datos y aprendizaje automático

¿Qué es la regresión de cresta?

El entrenamiento de redes neuronales profundas utilizando la propagación inversa tiene el problema de un gradiente de error que desaparece y que establece un límite sobre cuántas capas se pueden entrenar efectivamente, entonces, ¿por qué no usar un algoritmo genético para entrenar redes profundas, eliminando la propagación de errores?