¿Qué es un regresor de aprendizaje automático que tiene en cuenta la relación entre características?

Los modelos lineales pueden incorporar variables derivadas que capturan la interacción de las variables en bruto. La implementación del modelo lineal de R hace que sea conveniente hacerlo con su abstracción de “fórmula”. Si tiene un conjunto de datos X con una variable de salida yy variables de entrada x1, x2, x3 y cree que la relación de x2 y x3 proporciona más información que la que capturaría un modelo lineal que se ajusta independientemente a x2 y x3, puede ajustar un modelo lineal me gusta:

modelo = lm (y ~ x1 + x2 + x3 + x2: x3, X)

o con una sintaxis de fórmula aún más concisa

modelo = lm (y ~ x1 + x2 * x3, X)

Si x2 y x3 son variables numéricas, la sintaxis es literal y “interacción” significa “interacción multiplicativa”.

Supongo que responder con una breve discusión sobre las interacciones entre las características en los modelos lineales es más relevante para su pregunta porque los modelos lineales son en realidad los únicos modelos de aprendizaje automático que se me ocurren en el momento en que el procesamiento independiente de las características es el valor predeterminado. No preguntaría “¿cómo consigo que mi árbol de decisiones / red neuronal / etc. aproveche las interacciones entre las características” porque, por supuesto, lo están haciendo, les guste o no?

Ammedment a mi respuesta porque estoy recordando cosas viejas que escribí: bayes ingenuos es otro tipo común de modelo que no considera las interacciones de características.

Mirar :