¿Cuáles son algunos enfoques / reglas generales estándar para la ingeniería de características en el aprendizaje automático competitivo (o de otra manera)?

Tenga en cuenta que existen reglas generales específicas para los tipos de modelo (p. Ej., Árboles de clasificación frente a modelos de series de tiempo GARCH) y el dominio de la aplicación (p. Ej., Reconocimiento de imágenes frente a entornos). La cantidad de datos también exige diferentes enfoques. Por lo tanto, esos son los primeros pasos clave para decidir los enfoques para la ingeniería de características.

Convenientemente pasar por alto esos;), como hay muchos casos, aquí hay algunas reglas básicas que he recopilado para comenzar el proceso de ingeniería de características:

Aproveche el conocimiento del dominio. Comience con los principales trabajos de investigación o libros en el área temática para ver qué métodos de ingeniería de características comunes se han utilizado.

Un modelo con características requiere cantidades de datos cada vez mayores.

Normalmente distribuya las características aplicando transformaciones (modelos lineales).

Eliminar la colinealidad entre entidades. De un conjunto de características altamente correlacionadas, conserve una; puede seleccionar al azar o para facilitar la explicación en función de la RV que se está modelando.

Explore las interacciones de las funciones, por ejemplo, la función A * B puede ser mejor o una buena adición a las funciones A + B; pero es necesaria una explicación significativa de la interacción.

Hay literalmente miles más dependiendo del área de aplicación, pero creo que estos son algunos de los más generales.

Ingeniería de características feliz