¿Cuál es la diferencia entre ensacado y aprendizaje en conjunto?

Como otros han indicado, el embolsado es una de las muchas formas de hacer el aprendizaje conjunto. En el aprendizaje conjunto, desea aprender múltiples clasificadores que sean precisos y diversos . Este es el núcleo de los métodos de conjunto exitosos. Como describió Rollin Omari, el ensacado puede crear diversos conjuntos de datos agregando bootstrap. Sin embargo, esta es solo una de las muchas técnicas

  • Puede aplicar el empaquetamiento en las características, que se llama método de subespacio aleatorio, que también funciona muy bien.
  • Puede entrenar diferentes tipos de clasificadores en una o varias copias de datos (por ejemplo, SVM, árboles de decisión, bosque aleatorio, etc.), que también es aprendizaje conjunto.
  • Puede transformar los datos en otro espacio, como la proyección aleatoria, lo hace varias veces y obtiene diferentes instancias del conjunto de datos original y puede emplear el aprendizaje conjunto.
  • Puede calcular las características del núcleo o cualquier otra transformación, traducción o variación de los datos de entrada que puedan entrenar múltiples clasificadores diversos y precisos, lo más probable es que tenga un mejor rendimiento que el clasificador base.

La agregación de bolsas o bootstrap es uno de los algoritmos utilizados en el aprendizaje conjunto.

Los métodos / aprendizaje en conjunto se refieren al enfoque de aplicar o usar múltiples algoritmos para lograr un mejor desempeño predictivo / de clasificación. La similitud subyacente entre el embolsado y otros algoritmos de aprendizaje en conjunto es que recopilan varios algoritmos o clasificadores , los presentan con datos, hacen que cada uno clasifique los datos y finalmente hacen que el algoritmo del conjunto tome el voto ponderado de todas las predicciones o clasificaciones de los algoritmos / clasificadores.

Por lo tanto, el empaquetamiento es posiblemente uno de los algoritmos basados ​​en conjuntos más simples e intuitivos, se basa en el proceso de obtener réplicas del conjunto de datos de entrenamiento y entrenar a los clasificadores en estas réplicas. Así que esencialmente

  1. Se obtienen al azar diferentes subconjuntos de datos de entrenamiento de todo el conjunto de datos de entrenamiento (con reemplazo *).
  2. Cada subconjunto de datos de entrenamiento se usa para entrenar un clasificador diferente.
  3. Luego, los clasificadores individuales se combinan mediante un voto mayoritario simple de sus decisiones, donde el voto mayoritario elegido da como resultado la decisión del conjunto.

* El proceso de reemplazo es de donde proviene el término “bootstrapping”, ya que esto se refiere a una muestra de bootstrap . Esencialmente, todo el proceso depende de la idea de que se puede obtener una inferencia, un rasgo medible o una conclusión sobre una población a partir de los datos de la muestra, que se puede modelar mediante el muestreo de los datos de la muestra. Donde en el caso del aprendizaje en conjunto, los rasgos medibles o la inferencia son las predicciones o clasificaciones determinadas por cada clasificador.

Entonces, un ejemplo serían las alturas en una población. Tome una población suficientemente grande de tamaño N, lo suficientemente grande como para asegurar que cualquier forma de muestreo y remuestreo (bootstrapping) de la población no resulte repetidamente en superposiciones sustanciales. De la población, muestree un subconjunto del mismo, entrene a un clasificador en esta muestra de subconjunto, vuelva a muestrear la población reemplazando las alturas de las personas en el subconjunto anterior por las nuevas alturas de las personas de la población, y entrene nuevamente. Repita este proceso para todos los clasificadores en el conjunto con diferentes muestras de subconjuntos. Finalmente, cada clasificador debe determinar su propio rasgo medio o medible con respecto a las alturas de las personas en la población. El algoritmo del conjunto determina entonces qué significa este rasgo medio o medible al considerar la clasificación mayoritaria determinada por los clasificadores que componen el conjunto.

El embolsado (o agregación boostrap) es solo una de las formas posibles de construir un modelo de aprendizaje conjunto. Wikipedia le dará algunos buenos consejos sobre este tema.

More Interesting

¿Puede la IA reemplazar a los directores de música?

¿Por qué las variables ficticias realmente producen más precisión en algunos casos para el aprendizaje automático?

¿Qué otras áreas de aprendizaje automático pueden reemplazar el aprendizaje profundo en el futuro?

¿Hay repositorios de investigación en línea para la investigación de inteligencia artificial?

Cómo ingresar a mercados como el aprendizaje profundo (y cosas relacionadas, como el aprendizaje automático) y el software como servicio, como CEO

¿Cómo pueden prepararse la sociedad y los gobiernos para el 30% de los empleos que se pronostica que se perderán para los robots en 2030?

¿Se puede lograr AGI mediante la optimización basada en gradiente? Si no, ¿por qué OpenAI no se enfoca más en la neuroevolución?

¿Cuál sería su consejo para los estudiantes universitarios interesados ​​en IA y que pretenden obtener un título de maestría después de graduarse?

¿Qué es una inteligencia artificial de negocios?

¿Cuál es una instancia de la relación entre la visión por computadora (es decir, OpenCV) y el aprendizaje automático?

¿Cuál es la mayor hazaña de inteligencia que una persona haya logrado?

¿Qué sensores tiene el robot Nao?

Si los robots pudieran reemplazar todo el trabajo humano y un hombre fuera el propietario de todos los robots, ¿sería razonable gravar al hombre que los poseía?

Cómo aprender y aplicar el aprendizaje automático de nivel superior como programador

¿Cuándo comenzarán las grandes empresas a utilizar el aprendizaje automático para permitir que cada empleado haga su trabajo según su propio estilo y no a través del enfoque guiado de la empresa?