¿Cuáles son las diferencias entre la desigualdad de Hoeffding y la desigualdad de VC?

La desigualdad de Hoeffding (HI) es un límite de probabilidad de cola general para variables aleatorias limitadas. Los profesionales del aprendizaje automático lo asocian con la teoría del aprendizaje, los matemáticos con concentración de medida, los estadísticos con la ley de los grandes números. Además de la limitación, HI no hace suposiciones sobre las variables aleatorias.

El VC, o la desigualdad de Vapnik-Chervonenkis, es un resultado en la teoría del aprendizaje que nos permite controlar el error de generalización. Es más simple escribir en el caso de la clasificación binaria y usa HI para derivar un límite que es informativo (es decir, no trivial) incluso si el conjunto de hipótesis tiene un número infinito de elementos.

La principal diferencia entre la aplicación ingenua de HI versus el uso de VC es que la ingenua HI puede llevar a limitar una probabilidad por [math] \ infty [/ math]. Esto sucede porque la aplicación ingenua de HI supone que no hay superposiciones entre los eventos. VC aprovecha las superposiciones para proporcionar un límite finito.

Muchas cosas están ocultas debajo del trapo en esta respuesta. Puedo mejorarlo, pero realmente sugiero ver la siguiente conferencia de un curso de CaltechX: Aprender de los datos.

Ciencia de datosMinería de datos

Related Content

¿Cómo pasaste de ser un estudiante de sociología a alguien que cursa estudios de posgrado en ciencia de datos?

¿Big Data es una gran BS?

¿En qué cosas tienen que pasar el tiempo los científicos de datos que preferirían no hacerlo?

¿Cuáles son los campos donde se utiliza el análisis de big data?

¿Dónde puedo hacer capacitación en línea de ciencia de datos?

¿Cómo utilizan las empresas de alquiler el aprendizaje automático?

Cómo convertirse en un científico de datos

More Interesting

¿Vale la pena aprender habilidades de análisis de datos después de tener 5 años de experiencia en la industria de TI?

¿Hay algún programa de CS o análisis en línea sobre programación, ciencia de datos y big data con una universidad prestigiosa? Mi presupuesto es de $ 20,000- $ 30,000.

¿El núcleo RBF utilizado en SVM significa que la dimensión de proyección será la misma que el tamaño del conjunto de datos original?

¿Hay algún beneficio al agregar las características originales junto con las reducidas por PCA?

Cómo hacer una carrera en big data

¿Cómo ingresa un estudiante de física en el campo de la ciencia de datos?

¿Cómo manejan las empresas de big data la retención de datos?

¿Cuál es el salario promedio de un recién graduado universitario de Data Scientist en India?

¿Qué posibilidades futuras ve en la intersección de la ciencia de datos y las finanzas?

¿Hay un umbral de tamaño sobre el cual los datos se convierten en grandes datos?

¿Existe alguna herramienta de inteligencia empresarial que aproveche algoritmos como "Edgerank" para controlar qué informes se muestran?

¿El análisis de big data realmente puede ayudar a tomar decisiones comerciales?

¿Qué tan útil es el big data, dado que la gente cambia?

¿Cómo se puede utilizar la ciencia de datos en economía?

¿Cuál es la importancia de las estadísticas y las matemáticas en el campo de la ciencia de datos? ¿Cuántas matemáticas y estadísticas se requieren para convertirse en un científico de datos?

Web Analytics