¿Qué le parece más interesante: el análisis de series temporales o el aprendizaje automático? ¿Por qué?

La serie temporal es una especie de aventura artística. Se trata de interpretación y predicción, lo cual es muy divertido. Mi primer amor fueron las estadísticas, pero fue una relación superficial. La serie de tiempo fue el rebote y todavía me es querido.

El aprendizaje automático clásico como bosques aleatorios, algoritmos genéticos y máquinas de vectores de soporte es realmente bueno. Nunca me cautivaron las redes neuronales y, por extensión, el aprendizaje profundo. No soy un tipo artístico, pero me siento culpable cuando pinto un problema completamente en blanco. Esta noción de plug and play para resolver todo se siente intrínsecamente impura y contraria a mis creencias como analista. La agitación del estómago es una mejor descripción.

En mi época [me doy cuenta del récord de que tengo 29 años], pronosticando que las competiciones se ganaban cocinando cosas ordenadas pero aún comprensibles. Un momento memorable fue utilizar un algoritmo genético para seleccionar parámetros de series de tiempo y aprender con la estadística PRENSA. Gané, y fue muy divertido.

El aprendizaje profundo no está exento de encantos, pero como digo todo el tiempo, se usa mal a menudo.

Sé que me estoy volviendo realmente nerd en este momento, pero como dicen los niños: solo eres gelatina.

Aprendizaje automático

¿Cuánto tiempo debo pasar aprendiendo Python antes de pasar a otros aspectos de la ciencia de datos (análisis práctico, matemáticas, etc.)?

¿Cuántos tipos de técnicas utilizan los limpiadores profesionales?

¿Crees que es posible generar historias, pistas dadas, usando técnicas de PNL?

¿Qué es mejor para el aprendizaje profundo: TensorFlow o Chainer?

¿Qué biblioteca / framework AI es el mejor, OpenAI, OpenNN o TensorFlow?

¿Existe una versión de objetivos múltiples de regresión logística, regresión lineal, SVM, PCA, K-means o algún otro algoritmo de aprendizaje automático?

Obviamente, esta es una pregunta subjetiva, por lo que responderé subjetivamente. En mi opinión, el análisis de series de tiempo (TS) es más interesante que el aprendizaje automático “normal” (análisis transversal (CS)) porque es mucho más difícil y el campo parece mucho menos desarrollado (en términos de “pleno potencial”. Primero, aunque , uno debe mirar las diferencias entre los datos de TS y CS.

Los datos de CS se forman a partir de una muestra de observaciones independientes (esperas) (variables exógenas, es decir, dadas X y endógenas, es decir, modeladas, Y), de las cuales buscas aprender una función Y = F (X). Asume una forma (por ejemplo, regresión lineal, SVM, red neuronal …) y encuentra los parámetros Z en una función F (X, Z) que se aproxima a f (X). Las relaciones pueden ser realmente complejas, pero muchas veces el problema se puede resolver con más datos o más limpios, o con un modelo más sofisticado.

Los TS son similares, excepto que sus variables endógenas dependen casi siempre de valores anteriores (correlación o dependencia más compleja). Solo tiene 1 serie de tiempo para ajustar (debido al hecho de que las series de tiempo asumen un estado interno oculto, y que difieren de una serie a otra), por lo que no puede obtener más datos por serie de tiempo excepto al esperar (u obtener el panel datos … eso está fuera del alcance de esta respuesta). La necesidad de evitar el sobreajuste y comprobar los supuestos en el análisis de TS es mucho mayor que en el ML clásico. En resumen, se necesita mucho más cuidado en el análisis de TS: es mucho menos posible “magia”.

La parte en la que el pronóstico de TS es más interesante que la predicción de CS es en el hecho de que está prediciendo el futuro en función de valores pasados en lugar de dar predicciones de “qué pasaría si” (“los precios de la vivienda para viviendas como la suya serán más bajos este año” en lugar de “su casa cuesta Y en promedio”). Esto le da mucho más poder para tomar decisiones y optimizar su política / decisiones comerciales / lo que sea.

Ken Hutchison

Me gusta el aprendizaje automático, ya que tiene un enfoque un poco más amplio que las series de tiempo; Sin embargo, disfruté investigando un poco y jugando con los modelos longitudinales de aprendizaje automático (un tipo de problema de series de tiempo que involucra predictores). Creo que pueden aprender mucho unos de otros y estoy emocionado de ver más artículos en esta área combinada de investigación.

Ken Hutchison

More Interesting

¿Qué tipo de habilidades necesitarás para ingresar al aprendizaje profundo?

¿Cuál es la fortaleza y la debilidad del departamento de CS de Caltech, especialmente en el área de Machine Learning?

¿Existe una definición matemática para una máquina de vectores de soporte?

¿Se puede usar una máquina de Boltzmann profunda para la clasificación de imágenes en una base de datos que tiene solo mil imágenes y tiene características de imagen de valor real como unidades de entrada (en lugar de unidades de píxeles binarios)?

Para un problema de clasificación supervisada, primero busque grupos a través de un algoritmo de aprendizaje no supervisado, y para los miembros en el mismo grupo, asigne la misma etiqueta según un voto mayoritario. ¿Funciona bien?

¿Qué es un uso subestimado del aprendizaje automático?

¿Necesito normalizar mis vectores de características antes de usar Deep Learning?

¿Por qué alguien querría usar el refuerzo sobre el apilamiento?

¿Puede la red neuronal convolucional reconocer un objeto en cualquier condición?

¿Cuál es la diferencia entre soft k-means y el algoritmo EM?