¿Cómo se justifica el uso de la desigualdad de Hoeffding para demostrar que el aprendizaje es factible?

* A2A *

No. La hipótesis h se corrige antes de generar el conjunto de datos porque está tomando expectativas sobre las [matemáticas] X_i [/ matemáticas] pero no sobre las h. La expectativa se toma con una h fija.
En lugar de pensar si la hipótesis se genera antes o después del conjunto de datos, es más simple pensar que las expectativas se están tomando con una hipótesis fija. Si ayuda, puede imaginar que todas las hipótesis [matemáticas] h_i [/ matemáticas] son fijas antes de generar un único conjunto de datos D.
Aquí, g no es fijo sino que proviene de algún algoritmo. Sin embargo, siempre es uno de los [math] h_i [/ math]. Entonces, aquí, a diferencia de [math] h_i [/ math] en las ecuaciones anteriores, [math] g [/ math] es una variable aleatoria (con alguna distribución sobre h_i).
Si. La distribución de probabilidad es inherente a los datos y no tiene nada que ver con la hipótesis.

Machine Learning

Related Content

Quiero construir una copia casi perfecta de Eva de ex machina, entonces, ¿qué curso o área de informática necesito aprender profundamente?

¿Cómo analizaría programáticamente una oración y decidiría si responde con "eso es lo que dijo"? Resuma un algoritmo que, dada una oración, devuelve verdadero o falso para determinar si la declaración es apropiada.

¿Cuáles son las nuevas modificaciones en las redes neuronales recurrentes cuando se considera el aprendizaje profundo?

¿Se ha resuelto el problema de reconocimiento de caracteres escritos a mano?

¿Es la memoria y la potencia informática paralela masiva del cerebro más útil para el "entrenamiento" o la "prueba"?

¿Cuál es la diferencia entre aprendizaje automático, minería de datos y recuperación de información?

¿Cómo debe un principiante en Machine Learning enfocar una declaración de problema?

More Interesting

¿Qué es un núcleo universal en el contexto del aprendizaje automático?

¿Por qué el aprendizaje automático se usa mucho para la clasificación de anuncios de Google y menos para su clasificación de búsqueda? ¿Qué llevó a esta diferencia?

¿Hay algún programa en desarrollo que pueda escuchar un idioma y comenzar a aprenderlo, como en Star Trek?

¿Cuáles son las configuraciones adecuadas para la agrupación de documentos con K-means?

¿Por qué confiamos en la aleatoriedad de la búsqueda aleatoria en la optimización de hiperparámetros?

¿Por qué el aprendizaje del 'lenguaje ensamblador y máquina' se enfatiza menos en las universidades en comparación con el aprendizaje de lenguajes de programación generales?

¿Por qué son escasos los autoencoders escasos?

¿Cómo sugeriría Carlos Matias La Borde que un novato aprenda el aprendizaje automático?

¿Qué son las unidades recurrentes cerradas y cómo se pueden implementar con TensorFlow?

¿Las computadoras cuánticas mostrarían una aceleración para el aprendizaje automático?

¿Existe algún algoritmo específico para prevenir un ataque DDoS?

¿Cuáles son algunos conjuntos de datos sin resolver que son los objetivos de la investigación actual de Deep Learning?

¿Cómo detectamos las anamolias que causan la caída de la máquina y la pérdida de producción en la fabricación?

¿Por qué es tan popular Tensorflow?

¿Qué sería más beneficioso para un estudiante de tercer año de ECE, hacer aprendizaje automático u otros cursos?

Web Analytics