¿Cuál es una explicación intuitiva del aprendizaje probablemente aproximadamente correcto (PAC)?

El objetivo principal de la PCA es saber con certeza qué tan buena generaliza nuestra hipótesis. Podemos encontrar nuestra hipótesis h desde el espacio de hipótesis H. Pero, ¿qué tan seguros estamos de que esto h generaliza correctamente nuestro concepto objetivo C.

Ahora puede ver claramente en la imagen que (C XOR h) {región señalada con marcas de flecha} es nuestra región de error y queremos que la probabilidad de (C XOR h) sea <= E (epsilon), donde epsilon es el parámetro de error.

Ahora mi objetivo es encontrar la hipótesis h de manera que concuerde con C. Esta hipótesis se llama hipótesis coherente.

Pero para alcanzar esta hipótesis coherente, tenemos que pasar por todas las instancias disponibles, pero esto no se puede lograr en tiempo polinómico. Por lo tanto, hacemos la hipótesis que se basa en menos ejemplos. Queremos saber VERDADERO ERROR pero solo conocemos el error de entrenamiento.

El verdadero error se puede dar como:

Anotaciones:

–X: conjunto de todos los ejemplos posibles

–D: distribución de la que se extraen ejemplos

–H: conjunto de todas las hipótesis posibles

–N: el número de ejemplos en el conjunto de entrenamiento

–F: la verdadera función a aprender

Por lo tanto, queremos encontrar h para estar cerca de c.

Por lo tanto, una hipótesis h es aproximadamente correcta si, error (h) ≤ ε.

donde ε es un umbral dado, una pequeña constante

Ahora el tema principal de PAC que nos interesa:

Complejidad de la muestra: ¿En cuántas instancias de capacitación debo entrenar a mi clasificador para el aprendizaje PAC? Se puede administrar siguiendo la fórmula.

Su implementación se puede encontrar en:

Aquí n es el número de características. Y para los primeros ejemplos podemos ver que necesitaremos 280 ejemplos (instancias) para llegar a una hipótesis consistente.

Referencias

  1. Aprendizaje automático -Tom Mitchell
  2. algunas fotos para las diapositivas de la conferencia NPTEL.

Gracias.

More Interesting

Como teórico, ¿cómo guardas notas?

¿Por qué la gente cree que todos los teoremas sobre las máquinas de Turing son válidos cuando se habla de una computadora?

Para alguien que no sabe nada de informática, ¿por qué el conocimiento de las matemáticas es tan importante para ser un buen programador?

¿Es la matemática de la computación (UCLA) una especialidad decente para ir a la escuela de posgrado en informática?

¿Cuál es la diferencia entre el aprendizaje PAC y el aprendizaje agnóstico PAC?

Hice un programa en C que nos da la tabla de distribución normal, pero debo hacer un archivo Excel desde C. ¿Cómo puedo hacer esto?

¿Por qué no funciona mi función de búsqueda binaria?

¿Existe un algoritmo para contar el número de subcadenas cuya suma es divisible por 3?

¿Existe algún plan de estudios en línea que enseñe matemáticas con un enfoque en la programación o mecánica de videojuegos?

¿Qué es un gráfico bipartito?

¿Cuál es el significado de lo permanente en informática?

Un juego de 64 discos de Tower of Hanoi es jugado por un programa que realiza movimientos a una velocidad creciente. Comienza a 1000 movimientos por segundo. ¿Cuánto tiempo tomará?

¿Qué es una explicación intuitiva del teorema de Rice?

Estoy en mi último año como estudiante de ciencias de la computación y me encanta resolver problemas. Siempre trato de resolver los problemas, pero no logro crear soluciones rápidamente. Quiero mejorar para construir una lógica clara. ¿Dónde me estoy equivocando o qué debo hacer?

¿Cuántas soluciones totales hay en este problema combinatorio?