¿Qué es la generalización en el aprendizaje automático?

Se utiliza un algoritmo de aprendizaje automático para ajustar un modelo a los datos. El entrenamiento del modelo es como una infancia para los humanos … se presentan ejemplos al modelo y el modelo ajusta sus parámetros internos para comprender mejor los datos. Una vez que finaliza el entrenamiento, el modelo se libera sobre nuevos datos y luego usa lo que ha aprendido para explicar esos datos.

Ahora aquí es donde pueden surgir problemas. Si sobreentiende el modelo en los datos de entrenamiento, podrá identificar toda la información relevante en los datos de entrenamiento, pero fallará miserablemente cuando se le presenten los nuevos datos. Luego decimos que el modelo es incapaz de generalizar , o que está sobreajustando los datos de entrenamiento.

Aquí hay un gran ejemplo del fenómeno: modelar la felicidad en función de la riqueza.
En los tres diagramas superiores tenemos datos (x) y modelos (curvas discontinuas). De izquierda a derecha, los modelos se han entrenado cada vez más en los datos de entrenamiento. La curva de error de entrenamiento en el cuadro inferior muestra que el error de entrenamiento mejora cada vez más a medida que entrenamos más tiempo (aumentando la complejidad del modelo). Puedes pensar, genial! ¡Si entrenamos más, mejoraremos! Bueno, sí, pero solo mejor para describir los datos de entrenamiento. El cuadro superior derecho muestra un modelo muy complejo que alcanza todos los puntos de datos. Este modelo funciona muy bien en los datos de entrenamiento, pero cuando se presenta con nuevos datos (examine la curva de error de predicción en el cuadro inferior), lo hace abismalmente.

Entonces la lección aquí es esta. Para crear buenos modelos predictivos en el aprendizaje automático que sean capaces de generalizar, es necesario saber cuándo dejar de entrenar el modelo para que no se ajuste demasiado. Al igual que un padre, a veces un programador necesita saber cuándo echar a sus hijos de la casa y hacer que se vayan al mundo real. De lo contrario, sabrán todo sobre el sótano de sus padres y, sin embargo, serán incapaces de hacer algo productivo fuera de ese pequeño recinto. 😛

En el aprendizaje automático, la generalización generalmente se refiere a la capacidad de un algoritmo para ser efectivo en un rango de entradas y aplicaciones.

Como ejemplo, digamos que debía mostrarle una imagen de perro y pedirle que “clasifique” esa imagen por mí; suponiendo que lo haya identificado correctamente como un perro, ¿podría identificarlo como un perro si simplemente moviera el perro tres píxeles hacia la izquierda? ¿Qué pasa si lo puse al revés? ¿Aún podría identificar al perro si lo reemplazara con un perro de una raza diferente? La respuesta a todas estas preguntas es casi segura porque, como humanos, generalizamos con increíble facilidad. Por otro lado, el aprendizaje automático tiene muchas dificultades para hacer cualquiera de estas cosas; solo es efectivo para clasificar esa imagen específica.

Si bien el aprendizaje automático puede lograr un rendimiento sobrehumano en un determinado campo, el algoritmo subyacente nunca será efectivo en ningún otro campo que no sea para el que fue creado explícitamente porque tiene la capacidad de generalizar fuera de ese dominio. La generalización, en ese sentido, se refiere a la característica abstracta de la inteligencia que nos permite ser efectivos en miles de disciplinas a la vez. Es el tipo de generalización que actualmente, simplemente no existe en el aprendizaje automático a pesar de los mejores esfuerzos de los investigadores.

Espero que esto ayude y gracias por la pregunta!

Los algoritmos de aprendizaje automático se entrenan en algunos conjuntos de datos determinados, llamados conjuntos de entrenamiento. Durante el entrenamiento aprende patrones inherentes en los datos y la función de pérdida / función objetivo se reduce a través del entrenamiento. Ahora, si el modelo entrenado actúa sobre datos no vistos / nuevos datos / datos de prueba de la misma manera que lo hizo durante el entrenamiento desde la perspectiva del rendimiento, entonces el modelo se generaliza.

De hecho, el punto principal de convertir un sistema de aprendizaje automático en un producto escalable es la “generalización”. Cada tarea en ML se basa en el mismo objetivo, que es: venir con un algoritmo tan generalizado que actúa de la misma manera para todo tipo de distribuciones.

Intuitivamente, la generalización significa que usted predice bien en muestras no vistas. es decir, tener un bajo riesgo esperado [matemáticas] \ int_ {x, y} V (y, f (x)) p (x, y) dxdy [/ matemáticas] donde V es la función de pérdida.

Sin embargo, más formalmente, el error de generalización es la diferencia entre el riesgo esperado [matemáticas] I (f) = \ int_ {x, y} V (y, f (x)) p (x, y) dxdy [/ matemáticas] y el riesgo empírico [matemáticas] I_S (f_S) = \ frac {1} {N} \ sum ^ N_ {i = 1} V (y, f_S (x)) [/ matemáticas]:

[matemáticas] G = I (f) – I_S (f_S) [/ matemáticas]

como G es una función del conjunto de entrenamiento y también el número de puntos de datos N, a medida que N va al infinito, esta diferencia debería ir a cero. Puede encontrar más detalles aquí: Error de generalización – Wikipedia

Nota [math] f_S [/ math] es el predictor / hipótesis basado en el conjunto de datos entrenado S.

En la práctica, el error esperado se aproxima con un conjunto de datos de validación / desarrollo o un conjunto de prueba. Cualquier conjunto de puntos que no se ven. Otro enlace útil:

9.520 / 6.860, otoño de 2017

Generalización: la capacidad del modelo aprendido para adaptarse a una instancia invisible.

El objetivo del aprendizaje automático es permitir que el modelo aprendido se ajuste bien a una instancia invisible. Un modelo con una fuerte capacidad de generalización puede adaptarse bien a todo el espacio muestral.

Aunque el conjunto de entrenamiento suele ser solo una pequeña muestra del espacio muestral, todavía esperamos que refleje bien las características del espacio muestral; de lo contrario, es difícil esperar que el modelo aprendido del conjunto de entrenamiento funcione bien en todo el espacio muestral. En términos generales, cuanto más grande es el conjunto de trenes, más información podemos obtener de D. Por lo tanto, es más probable que el modelo aprendido tenga una fuerte capacidad de generalización.

La generalización generalmente se refiere a la capacidad de un modelo ML para desempeñarse bien en nuevos datos no vistos en lugar de solo los datos en los que se entrenó. Está fuertemente relacionado con el concepto de sobreajuste. Si su modelo está sobreajustado, entonces no se generalizará bien.

Tiene que ver con qué tan bien se ajusta un modelo en un conjunto de datos inicial en otros conjuntos de datos. Por lo general, validamos de forma cruzada nuestro modelo utilizando conjuntos de entrenamiento y prueba, de modo que podamos estar seguros de que el modelo al menos se generaliza bien de una parte de un conjunto de datos a otra. Idealmente, hay otro conjunto de datos recopilados, de modo que podamos agregar certeza a la eficacia de ese modelo en problemas nuevos pero relacionados.

More Interesting

¿Qué es la clasificación en el aprendizaje automático?

¿Pueden los robots estar vivos?

¿Cuál es la diferencia entre aprendizaje automático, red neuronal y cómo se relacionan con el aprendizaje profundo?

¿Por qué todos están interesados ​​en las redes neuronales profundas ahora cuando otros sistemas de inteligencia artificial como las máquinas LISP fueron promocionados y no pudieron obtener una gran adopción en el pasado?

¿Qué pasa si las prostitutas son reemplazadas por robots?

¿Cuándo será la IA realidad?

¿Cuáles son los diferentes campos en IA en consideración con la informática y la programación?

¿Cómo puede una computadora predecir el acento que uno escucharía de alguien cuyo idioma nativo es A cuando habla un segundo idioma B?

¿Cómo puede ser utilizada la inteligencia artificial por el gobierno de la India?

¿Qué cambios traerá al mundo la red neuronal profunda CUDA de Nvidia?

¿Por qué los fabricantes de televisores no agregan asistentes de inteligencia artificial como Alexa a sus televisores?

¿Tiene sentido hacer una tesis maestra sobre predicción del precio del petróleo utilizando el aprendizaje automático?

Rethink Robotics (anteriormente Heartland Robotics) lanzará un robot con un precio "disruptivo" en unas pocas semanas. ¿Tendrá esto un efecto inmediato sobre el empleo manufacturero o la economía?

¿Deberíamos establecer el comunismo cuando los robots toman todos los trabajos?

¿Cómo funciona una máquina de tensión neural?