Los modelos lineales pueden incorporar variables derivadas que capturan la interacción de las variables en bruto. La implementación del modelo lineal de R hace que sea conveniente hacerlo con su abstracción de “fórmula”. Si tiene un conjunto de datos X con una variable de salida yy variables de entrada x1, x2, x3 y cree que la relación de x2 y x3 proporciona más información que la que capturaría un modelo lineal que se ajusta independientemente a x2 y x3, puede ajustar un modelo lineal me gusta:
modelo = lm (y ~ x1 + x2 + x3 + x2: x3, X)
o con una sintaxis de fórmula aún más concisa
- Si una película de 2 horas sin comprimir suele ser de 1 terabyte, ¿cómo consiguen que quepa en un disco?
- ¿Cómo se guardan las imágenes como imágenes digitales?
- Bajo el esquema de codificación de caracteres de Windows, ¿cómo se relaciona el juego de caracteres chino tradicional con el juego de caracteres chino simplificado?
- Cómo determinar el tamaño de un archivo de video
- ¿Cuáles son algunos concursos / tareas populares en el análisis morfológico de los lenguajes naturales?
modelo = lm (y ~ x1 + x2 * x3, X)
Si x2 y x3 son variables numéricas, la sintaxis es literal y “interacción” significa “interacción multiplicativa”.
Supongo que responder con una breve discusión sobre las interacciones entre las características en los modelos lineales es más relevante para su pregunta porque los modelos lineales son en realidad los únicos modelos de aprendizaje automático que se me ocurren en el momento en que el procesamiento independiente de las características es el valor predeterminado. No preguntaría “¿cómo consigo que mi árbol de decisiones / red neuronal / etc. aproveche las interacciones entre las características” porque, por supuesto, lo están haciendo, les guste o no?
Ammedment a mi respuesta porque estoy recordando cosas viejas que escribí: bayes ingenuos es otro tipo común de modelo que no considera las interacciones de características.