La ingeniería de características y la selección de características no son mutuamente excluyentes. Los dos son útiles. Sin embargo, diría que la ingeniería de características es más importante, especialmente porque realmente no se puede automatizar.
En el mundo real, mi equipo en Google genera un informe de importancia de la función como el que vinculaste cada vez que entrenamos a nuestro clasificador. Es útil, y complementa la ingeniería de características, ya que proporciona información sobre una nueva característica en comparación con las existentes y también qué tan bien se compara una característica ajustada con la original.
La selección de funciones es útil en sí misma, pero en su mayoría actúa como un filtro, silenciando las funciones que no son útiles además de las funciones existentes. Hacer que un sistema de clasificación del mundo real funcione bien es comprender el dominio del problema y crear creativamente buenas características. La selección de funciones no hace nada por ti allí.
- ¿Cuál es la forma más fácil de entender el análisis de componentes principales?
- ¿Qué es exactamente la monitorización neuronal remota?
- ¿El aprendizaje automático es malo para la economía?
- ¿Cómo se puede aplicar el aprendizaje profundo a los sistemas de recomendación?
- ¿Cuáles son algunas ideas importantes / brillantes en el aprendizaje automático?
En una nota más técnica y práctica, hemos descubierto que si toma una señal buena pero dispersa (característica de alta precisión / baja recuperación) y agrega ruido aleatorio para completar la dispersión, la medida de importancia variable aleatoria del bosque aumenta. Esta es una mala calidad de la medida.