¿Cuál es la explicación intuitiva y práctica del algoritmo AdaBoost utilizado en el artículo de Viola-Jones sobre detección de rostros, en lenguaje moderadamente técnico?

No es una respuesta muy técnica.

Adaboost es una construcción de clasificadores fuertes de varios clasificadores débiles.
Clasificador débil: un clasificador débil es un clasificador que funciona ligeramente mejor que un clasificador aleatorio cuya precisión de clasificación es ligeramente superior al 50% (a diferencia de SVM, redes neuronales)
Llegando al ejemplo: supongamos que desea clasificar una imagen como cara o no cara
puede tomar el color de la piel como una característica, es un clasificador débil porque otras partes del cuerpo tienen la misma propiedad. Tiene una alta tasa de falsos positivos pero una baja tasa de falsos negativos, es decir, si es una cara, debe tener color de piel, pero si tiene color de piel, no necesita ser una cara.
entonces puedes aprovechar el hecho de que la cara tendrá vello por encima (una región oscura a su alrededor). Este también es un clasificador débil porque otras partes del cuerpo también pueden tener un fondo que satisfaga esto.
luego, dentro de las regiones que satisfacen las dos anteriores, buscamos otras características faciales como ojos, labios, etc.

Entonces, clasificamos los clasificadores débiles en cascada, cada uno de ellos tiene una alta tasa de falsos positivos pero baja, y el resultado final es el mismo que el de un clasificador fuerte.

La figura anterior muestra N clasificaciones débiles en cascada. Si pertenece a la CLASE, debe satisfacer a todos los clasificadores débiles. Cada uno de los clasificadores puede rechazar una entrada negativa (No CLASE) pero no puede decidir a favor de la CLASE.

Ps: es solo un ejemplo de clasificadores débiles en cascada y difiere del algoritmo original. Hacer cascada y tomar una combinación lineal son más o menos lo mismo. En combinación lineal, la salida final es una suma ponderada de salidas de clasificadores individuales donde los pesos son inversamente proporcionales a los errores respectivos.

More Interesting

¿DevOps mejora las operaciones de ciencia de datos y aprendizaje automático?

¿Qué tan importante es Octave como primer paso en Machine Learning? ¿Se utiliza en la industria?

¿Es Theano (biblioteca de Python ML) una buena biblioteca si quiero crear una aplicación comercial?

Con referencia a AdaBoost, ¿qué se entiende exactamente por 'ponderado' cuando se dice que entrena a un clasificador débil dada una distribución ponderada?

¿Cuáles son las ventajas de las máquinas de vectores de soporte (SVM) en comparación con la regresión lineal o la regresión logística?

¿Cuáles son las mejores escuelas de posgrado canadienses para estudiar CS en Inteligencia Artificial, aprendizaje automático, procesamiento de lenguaje natural y minería de datos, especialmente para estudiantes internacionales?

¿Cómo podría usar el aprendizaje automático para clasificar los datos 1D?

¿Qué tan lejos estamos de usar el reconocimiento de voz como interfaz de usuario en un teléfono para cerca del 100% de todas las funciones (sin entradas de teclado o deslizamiento)?

¿Debo obtener una MacBook Pro con 16 GB de RAM (máximo) para el trabajo de aprendizaje automático, a pesar de que puedo llevar cosas intensas a una instancia de Google Cloud?

¿Cómo podría el aprendizaje automático mejorar la nariz electrónica?

¿Cómo puede motivar a un estudiante de CS para que aprenda Machine Learning?

¿Cuáles son algunas aplicaciones actuales de las redes neuronales convolucionales además del análisis de imagen, video y discurso?

¿Cómo manejan las empresas en Silicon Valley sus datos de flujo de red?

¿Cuáles son las características únicas de una red neuronal en comparación con otras técnicas de aprendizaje automático?

¿Cuál es el mejor código comercial de reconocimiento facial?