¿Cuál es la diferencia entre un contenedor y un algoritmo de filtro en Data Mining / Machine Learning?

Una de las cosas que es deseable en un modelo de aprendizaje automático es que el modelo debe tener una varianza baja , es decir, no debe ajustarse demasiado a los datos de entrenamiento y perder la capacidad de generalizar a datos invisibles. Una de las formas en que esto podría hacerse es minimizar la cantidad de características que usa el modelo para usar solo las características más informativas. En el caso de un modelo de regresión, esto generalmente se conoce como selección de subconjunto, es decir , seleccionar un conjunto de variables de entrada casi óptimo que minimizaría la varianza y maximizaría la generalización del modelo. Hay dos formas de realizar una selección de subconjuntos:

  1. Métodos de filtro: en tales métodos, el procedimiento de selección de subconjuntos es independiente del algoritmo de aprendizaje y generalmente es un paso de preprocesamiento. Obviamente, esto conduce a un proceso de aprendizaje más rápido, pero es posible que el criterio utilizado en el paso de preprocesamiento dé como resultado un subconjunto que puede no funcionar muy bien en el algoritmo de aprendizaje.
  2. Métodos de envoltura: en estos métodos, la selección del subconjunto se realiza en función del algoritmo de aprendizaje utilizado para entrenar el modelo en sí. En términos generales, cada subconjunto propuesto por la medida de selección de subconjunto se evalúa en el contexto del algoritmo de aprendizaje. Obviamente, esto significa que no se pueden utilizar algoritmos de aprendizaje computacionalmente intensivos.

[1] proporciona una exploración empírica decente de los dos métodos para problemas de regresión; La figura 1 en particular es bastante útil. Si desea una explicación más detallada y motivada teóricamente en el contexto de los clasificadores de árbol de decisión, lea el clásico artículo ICML [2].

Referencias
[1] Comparación entre un filtro y un enfoque envoltorio para la selección de subconjuntos variables en problemas de regresión. 2000. Ivan Kojadinovic y Thomas Wottka. Actas del Simposio europeo sobre técnicas inteligentes.
[2] Características irrelevantes y el problema de selección de subconjunto. 1994. John et al. Actas de la Conferencia Internacional sobre Aprendizaje Automático.

Ambos intentan encontrar las mejores características de un amplio conjunto de características, según S´anchez-Maro˜no et al http://www.dice.ucl.ac.be/Procee

Filtrar algoritmos, en cuyo caso el método de selección se utiliza como un preprocesamiento que no intenta optimizar directamente el rendimiento del predictor (método de aprendizaje automático).

Algoritmos de envoltura, en los que el método de selección optimiza directamente

rendimiento predictor

More Interesting

¿Cuáles son algunas características comunes utilizadas en la clasificación basada en audio?

¿Qué tan exitoso ha sido el modelo tópico LDA en la categorización de imágenes?

En la mayoría de los entrenamientos de precisión de CNN, ¿por qué la precisión de validación no aumenta suavemente en lugar de con tantas ondas?

¿Qué tan poderoso es la PNL?

¿Cuál es el propósito de usar más de una capa convolucional en una red neuronal convolucional?

¿Qué técnicas utilizadas en el procesamiento del lenguaje natural son aplicables a otras áreas del aprendizaje automático?

¿Cuáles son los temas candentes / nuevos en el aprendizaje estadístico?

¿Tiene sentido el uso de bosques aleatorios en los datos financieros si se supone que los rendimientos dependen en serie (es decir, que los rendimientos actuales dependen de los rendimientos pasados)?

¿Cómo hace un auto Tesla el aprendizaje automático?

Visión por computadora: ¿Cuáles son algunos problemas de investigación abierta en la recuperación de imágenes basada en contenido?

¿Cuál es la diferencia entre el aprendizaje por refuerzo y la optimización?

¿Qué tipo de proyectos de aprendizaje automático puedo hacer? ¿Qué libros me recomiendan aprender? Estoy interesado en usar Python.

¿Cómo podría usar el aprendizaje automático para clasificar los datos 1D?

¿Cuáles son algunas optativas de matemáticas avanzadas útiles para un estudiante universitario en CS (junior) que se inclina hacia el aprendizaje automático para la escuela de posgrado?

¿En qué campos todavía no se ha aplicado el aprendizaje automático (o está menos explorado)?