Tomemos un ejemplo de regresión. Supongamos que se le dan algunos puntos (denotados como x en la figura a continuación como una relación entre el tamaño de la casa y su precio). Se le pide que encuentre un modelo que represente estos puntos de la mejor manera posible. Hay infinitas maneras de hacerlo. La forma más simple es dibujar una línea recta, de modo que todos los puntos se encuentren en esa línea. Sin embargo, como se da cuenta de que este es un mal ajuste porque la mayoría de los puntos no se encuentran en la línea, llamamos a esta situación un ajuste insuficiente. Alternativamente, puede dibujar una función compleja que se ajuste a cada punto, vea la figura correcta. Esta situación se llama sobreajuste; posiblemente no se generalizará en un nuevo punto porque se ajusta demasiado a los puntos dados. Su mejor apuesta es la trama media, donde encuentra un polinomio cuadrático que representa los datos bastante bien. En este problema, básicamente está tratando de ajustar diferentes polinomios de grado ‘d’. Por lo tanto, en este ejemplo, su parámetro es el grado de polinomio, es decir, ‘d’. De manera similar para otros algoritmos, hay diferentes parámetros. Dependiendo de cómo los elija, puede afectar su límite de clasificación y el ajuste del modelo. Algunas opciones pueden conducir a un ajuste del modelo subóptimo (bajo ajuste o sobreajuste), mientras que otras opciones pueden conducir al ajuste óptimo o casi óptimo del modelo. En este ejemplo, d = 2 es un ajuste casi óptimo pero no perfecto, porque todos los puntos no se encuentran en la curva.
Para una discusión detallada sobre hiperparámetros, lea esta publicación: ¿Qué son los hiperparámetros en el aprendizaje automático?
- ¿Por qué se usaría una máquina de estado finito?
- ¿Cómo medir la precisión del procesamiento del lenguaje natural? ¿Existe algún criterio estándar o aceptable para la industria?
- ¿Qué funciones sirve SQL Server Integration Services (SSIS)?
- ¿Cuáles son las principales diferencias entre el análisis predictivo tradicional y el aprendizaje automático?
- ¿Cuáles son los algoritmos de aprendizaje automático que se sabe que no son transparentes?
(Fuente – 3. Machine Learning 102: Consejos prácticos)