¿Cómo se calcula el punto de ruptura de un algoritmo de aprendizaje?

La explicación para la destrucción se da aquí:

Dimensión VC

El punto de quiebre no es más que la dimensión VC + 1.

Básicamente, lo que está tratando de hacer es averiguar la cantidad de puntos necesarios para lograr una tarea que su modelo no puede clasificar perfectamente (con cero clasificaciones erróneas).

Ahora el perceptrón es un modelo de clasificación lineal. En el caso bidimensional, el límite de decisión es una línea.

Si tiene un punto en un plano que toma el valor + o -, obviamente puede tener una línea y clasificar todo en el lado de ese punto como ese valor.

Por lo tanto, un perceptrón 2D puede romper el conjunto de 1 punto (cero clasificaciones erróneas).

Si tiene dos puntos en un plano, hay cuatro casos.

El punto A es + y el punto B es +.

Puede tener una línea tal que dos puntos sean un lado de la línea.

El punto A es – y el punto B es +.

Puede tener una línea tal que el Punto A esté a un lado de la línea y el Punto B esté al otro lado.

El punto A es + y el punto B es -.

Puede tener una línea tal que el Punto A esté a un lado de la línea y el Punto B esté al otro lado.

El punto A es – y el punto B es -.

Puede tener una línea tal que dos puntos sean un lado de la línea.

Por lo tanto, un conjunto de dos puntos puede romperse.

Considere el caso de tres puntos en un plano:

Las tareas son

A B C
+ + +
+ + –
+ – +
+ – –
– + +
– + –
– – +
– – –

En cada caso, encontrará sin importar cuál sea la asignación, siempre que A, B, C estén en un plano, podrá encontrar una línea que los clasifique perfectamente.

Tenga en cuenta la excepción cuando son colineales,

Suponga que A es +, B se encuentra entre A y C y es -, y C toma +, no podrá encontrar una línea que los clasifique perfectamente. Pero eso no nos importa, solo lo necesitamos para poder clasificar perfectamente todas las asignaciones posibles para una ubicación (valor x), no todas las ubicaciones.

Por lo tanto, un conjunto de tres puntos puede romperse.

Sin embargo, si tiene cuatro puntos, sin importar cuáles sean sus valores de x, no podrá encontrar una línea que clasifique todas las asignaciones posibles perfectamente.

Entonces, un conjunto de cuatro puntos no puede ser destruido por un perceptrón 2D (línea) y 4 es el punto de ruptura.

Ahora, pasemos a la pregunta 4.

Como estamos tratando en 3D, el límite en este caso es un plano. Además, como se dijo antes, no tenemos que obtener una asignación perfecta para todos los valores de x.

Si tiene uno de los cuatro puntos en un plano diferente, encontrará que un avión puede destruirlos.

Pero un avión no puede romper un conjunto de cinco puntos, por lo que 5 es el punto de quiebre.

Si tuvo problemas para visualizar lo anterior, vea este video:

Para la pregunta 6,

Básicamente, tiene puntos en una línea que deben clasificarse y dos intervalos de longitud arbitraria para clasificarlos.

Como tiene dos intervalos, puede romper un conjunto de cuatro puntos.

Pero si tiene 5 puntos y son de signos alternos (+ – + – +), no puede romperse (clasificarlos perfectamente). Por lo tanto, 5 es el punto de quiebre.

More Interesting

¿Qué problemas o conjuntos de datos existen cuando usar el impulso da mejores resultados que usar un SGD simple?

Cómo automatizar la selección de características en un conjunto de datos que involucra muchos datos no numéricos

¿Cuál es la diferencia entre gradiente de política determinista y gradiente de política estocástica?

¿Podemos usar el modelo oculto de Markov para inferir las variables ocultas del universo?

¿Cuál es la diferencia entre las redes de Markov y las redes bayesianas?

En una unidad LSTM, ¿cuál es la razón detrás del uso de una activación de tanh?

¿Cuáles son las principales conferencias sobre inteligencia artificial, procesamiento del lenguaje natural y aprendizaje automático?

Cómo encontrar el siguiente número de la lista de números anteriores usando el aprendizaje profundo

¿Crees que la tecnología 'block chain' es la próxima gran novedad en informática?

Cómo detectar logotipos si están distorsionados

He estado aprendiendo la red neuronal de retroalimentación y la propagación hacia atrás durante 3 meses y todavía no puedo entenderlo, ¿qué debo hacer?

¿A qué tipo de personalización en Machine Learning se refería Andrew Ng en su artículo de Harvard Business Review sobre las capacidades de IA?

¿En qué casos debo usar TensorFlow, PyTorch y Caffe2?

¿Cómo se puede utilizar el aprendizaje automático para mejorar el software de gestión de proyectos?

¿Dónde puedo encontrar el algoritmo para encontrar los otros nombres de la entidad popular?