Cuando un científico de datos descubre un patrón de mercado constante, ¿cómo puede saber cuánto durará? Si es fugaz, explotarlo no tendrá sentido.

Usted no sabe ‘consistente’ y ‘duradero’ son todos términos relativos al dominio: ¿significan días, semanas, meses, años, décadas o siglos? Existen fenómenos bien conocidos tanto de “deriva del modelo” como de “deriva de datos . De hecho, cambiemos su afirmación y supongamos que la mayoría del comportamiento humano varía en el tiempo, durante un período .

Algunos dominios son notoriamente efímeros:

  • moda, (‘moda rápida’)
  • películas, música, videojuegos (piensa en Pokémon Go, Candy Crush, Farmville)
  • Restaurante informal / de comida rápida / bebidas / preferencias de dulces
  • en general, cualquier aplicación o servicio en el que el cliente tiene poca adherencia y recibió un gran descuento (alto CAC) especialmente. muy lujoso, por ejemplo, kits de comida, entrega de restaurantes, servicios de citas, suscripciones mensuales de caja, servicio de teléfono celular … mire la historia de advertencia de por qué Blue Apron fue un día un IPO querido y luego, después de la adquisición de Amazon-Whole Foods, dañó los productos.

Dominios que son más lentos, pero que aún cambian:

  • comportamiento de seguros y productos financieros. Compra / alquiler de vivienda.

En general, para segmentos que cambian rápidamente, no hay un conjunto de entrenamiento (ya que si creáramos uno, envejecería instantáneamente); en su lugar, usamos pruebas Multi-Armed Bandit para permitirnos simultáneamente explorar / explotar y ejecutar muchos experimentos simultáneos (‘A / B / C / D / … test’), todo mientras estamos en producción.

(Una pregunta relacionada: construí un modelo en R usando datos históricos. ¿Cómo lo uso para datos en tiempo real?)

Este es un análisis de series de tiempo.

Como regla general, se puede suponer que un patrón de mercado consistente dura un período igual a 1/10 (más o menos) de la longitud de los datos de la serie temporal.

Entonces, si tiene datos de series de tiempo de una década, puede suponer que un patrón de mercado consistente puede durar aproximadamente un año.

La longitud de los datos de la serie temporal es muy crucial. Y ahí es donde muchos de nosotros nos equivocamos. Muy a menudo hacemos juicios basados ​​en datos inadecuados.

More Interesting

¿Debería haber siempre más datos de entrenamiento que datos de prueba? ¿Por qué?

Cómo ver la pista de big data relacionada con su carrera objetivo

¿Se han desacreditado o confirmado los ciclos de Edward Dewey en el análisis de datos moderno?

¿Realmente hace una diferencia entre los programas de EM de uno y dos años en los Estados Unidos, con respecto al campo de la ciencia de datos en términos de conseguir un trabajo también?

¿Qué es la liberación de datos?

¿Cuál es la mejor manera de comenzar con la ciencia de datos?

¿Cuál es la diferencia entre el análisis empresarial y la ciencia de datos?

¿Cómo se relacionan la ciencia de datos y el aprendizaje automático, si es que están relacionados?

¿Cuáles son algunas ideas muy buenas de minería de datos o algoritmos de búsqueda basados ​​en gráficos para un proyecto menor?

¿Hay empresas en la India que empleen estudiantes universitarios y los capaciten en Big Data Analytics / Data Science?

¿Orientación profesional para personas de 25 años de edad con inclinación cuantitativa con datos / habilidades de programación?

¿En qué orden deben realizarse estas operaciones de ciencia de datos: munging, limpieza, escalado, transformaciones y modelado?

Cuando observamos el muestreo, ¿por qué necesitamos 30 datos?

Cuando trabajamos en aprendizaje automático en big data, ¿podemos usar la biblioteca scikit-learn con MLlib?

Soy un desarrollador de aviónica. No tengo mucho conocimiento sobre qué es la ciencia de datos y la minería. ¿Cómo es esto diferente de big data? ¿Cómo está ayudando esto para la seguridad de la aviación y el MRO de las aeronaves?