El kit de herramientas de aprendizaje automático y el kit de herramientas econométricas se han utilizado tradicionalmente para responder preguntas distintas: mientras que el aprendizaje automático se centra en la predicción, la econometría, especialmente la inferencia causal, se centra en la toma de decisiones.
Pongamos un ejemplo. En tecnología, a menudo hay un enfoque en descubrir qué “momento mágico” engancha a los nuevos usuarios en los próximos meses y años. ¿Qué hito simple lleva a la lealtad del cliente a largo plazo?
El ex ejecutivo de Facebook, Chamath Palihapitiya, explicó que una vez que Facebook descubriera que los usuarios retendrían si llegaban a 7 amigos en 10 días, hacer que esa experiencia sea una realidad para todos los usuarios se convirtió en un “único foco” para la empresa. Twitter, Zynga, Dropbox, Slack y otros han mencionado identificar momentos mágicos similares en sus propios contextos. ¿Cómo encontramos el nuestro?
- Tengo un conjunto de datos con 14 características. Quiero aplicar SVM en él usando R. ¿Cómo puedo?
- ¿Cómo la IA puede ser útil en Big Data?
- ¿Cuáles son algunos buenos métodos para el procesamiento previo de datos en el aprendizaje automático?
- ¿Cuál es el resultado de un modelo de omisión de gramo en Word2Vec?
- ¿Existe un programa de tipo PageRank para organizar mis canales RSS diarios?
Si queremos predecir si un usuario se quedará o no por el próximo año en función de su comportamiento en el primer mes, aprovechamos las técnicas de aprendizaje automático. En el enfoque más simple, entrenamos un modelo de clasificación para predecir la retención en función del (muchas medidas posibles) del comportamiento del primer mes. Usando técnicas de regresión regularizadas, deberíamos poder reducir a un conjunto razonable de comportamientos que predicen poderosamente la retención. Esto puede ser útil para estimar el valor de vida esperado del usuario, por ejemplo, para optimizar el gasto de marketing.
Pero el momento mágico no se trata de predecir la retención en absoluto. En cambio, se trata de determinar el conjunto de comportamientos del primer mes que causan la retención. En el caso de Facebook, si los usuarios que adquieren más amigos al principio tienen más probabilidades de retener en gran medida porque son inherentemente diferentes (por ejemplo, más sociales, más interesados de forma innata en el producto, más adictos a la tecnología), entonces tomar decisiones estratégicas de producto para invertir en amistad temprana basada en la correlación observacional entre amistad temprana y retención produciría resultados comerciales deslumbrantes.
Las técnicas econométricas son las herramientas principales en nuestro juego de herramientas para determinar la causalidad. Entonces, en lugar de centrarnos en la predicción, un lugar en el que podríamos comenzar sería ejecutar un modelo de regresión logística, hacer retroceder la retención de un año en las características de comportamiento del primer mes y agregar una serie de controles intuitivos para los principales factores de confusión que podrían influir tanto en el fuente de referencia del usuario y otros representantes de la calidad del usuario y el interés inherente en el producto.
Por supuesto, la regresión controlada es solo un enfoque. Hay una gama de otros enfoques econométricos más sofisticados para estimar las relaciones causales a partir de la variación natural, incluido el diseño de regresión discontinua, la diferencia en diferencias, el modelado de efectos fijos y el modelado de variables instrumentales.
Si bien cada uno de estos métodos econométricos es poderoso para descubrir relaciones causales, uno de los principales desafíos con las técnicas estándar es que la selección de modelos y variables son relativamente poco arraigadas. La buena noticia es que los métodos para el modelo basado en principios y la selección de características son fundamentales para el aprendizaje automático. Y en los últimos años, visionarios académicos como Victor Chernozhukov, Susan Athey, Guido Imbens, Alberto Abadie y otros han estado desarrollando cuidadosamente adaptaciones que combinan lo mejor de lo que el aprendizaje automático tiene para ofrecer con las aplicaciones de inferencia causal que más importan.