¿Cómo se debe elegir el parámetro [math] l [/ math] en la regresión de mínimos cuadrados parciales?

El parámetro [math] l [/ math] en PLS es análogo al número de componentes en PCA.

En el mundo de la quimiometría, existe una heurística común para seleccionar el número de componentes ([matemática] l [/ matemática]).

1) Comience con [matemáticas] l = 1 [/ matemáticas]
2) Calcule [matemática] R ^ 2 [/ matemática] y una [matemática] R ^ 2 [/ matemática] con validación cruzada (llamada [matemática] Q ^ 2 [/ matemática]). Si [matemáticas] R ^ 2 [/ matemáticas] está en un nivel satisfactorio, deténgase.
3) De lo contrario, incremente [matemática] l [/ matemática] hasta que [matemática] R ^ 2 [/ matemática] alcance un nivel de varianza satisfactorio explicado (típicamente 0.8 o más), o hasta que la [matemática] Q ^ 2 [/ matemática ] número comienza a disminuir.

([matemática] Q ^ 2 [/ matemática] no aumenta monotónicamente como [matemática] R ^ 2 [/ matemática] – a menudo alcanzará un pico)

En teoría, se supone que la [matemática] Q ^ 2 [/ matemática] representa la “bondad de la predicción”, y en este contexto, se supone que protege contra el sobreajuste. Pero en la práctica, tiene limitaciones severas.
¡Cuidado con q2! [Modelo de gráfico J Mol. 2002]

No estoy necesariamente respaldando el enfoque anterior, sino simplemente proporcionando un punto de datos en cuanto a una práctica estándar que he encontrado.

Estadística (disciplina académica)Machine LearningRegresión (estadística)

Related Content

¿Cuáles son los algoritmos principales detrás de Google Translate?

¿Qué es un núcleo universal en el contexto del aprendizaje automático?

¿Qué curso se sugiere para el aprendizaje automático que sea más un curso basado en proyectos?

Cómo decidir si usar modelos de aprendizaje automático supervisados o de refuerzo

¿Qué clasificador es el más adecuado para clasificar los signos en un video de lenguaje de señas?

¿Qué es una función de costo?

¿Cuáles son los efectos de una estimación de densidad de kernel en los momentos de una distribución?

Parece que necesita probar diferentes factores, cuánto de la varianza se puede explicar. En el siguiente ejemplo, 5 factores explican el 99% de la respuesta.

Página en ucla.edu (SAS)

Dirk Nachbar

More Interesting

¿Necesito almacenar los pesos en los pasos de tiempo anteriores además de las activaciones cuando uso la propagación hacia atrás a través del tiempo en redes neuronales recurrentes?

¿Qué matemática debería revisar / aprender si quiero comprender a fondo el modelado de efectos mixtos / modelado de regresión?

¿Qué tipos de trabajos están disponibles en la industria financiera para un máster en ML / AI graduado?

Cómo hacer ingeniería de características en aprendizaje automático

¿Es justo evaluar una red neuronal profunda solo de acuerdo con su rendimiento en algunos conjuntos de datos específicos?

¿Cómo puede un estudiante graduado de primer año en ciencias de la computación encontrar un trabajo en minería y análisis de datos después de graduarse?

Cómo obtener trabajos de aprendizaje automático sin una educación formal

¿Cuáles son las unidades de análisis utilizadas en el reconocimiento de voz automático?

¿Se pueden resolver todos los problemas de aprendizaje automático mediante redes neuronales?

¿A qué tipo de personalización en Machine Learning se refería Andrew Ng en su artículo de Harvard Business Review sobre las capacidades de IA?

Cómo guardar un modelo de red neuronal de convolución después del entrenamiento

¿Cuáles son las ventajas y desventajas de usar Statsmodels sobre Scikit-learn?

¿Por qué todas las principales empresas de tecnología abren fuentes principales de su tecnología de inteligencia artificial?

¿Cuál es la mejor manera de encontrar el conjunto de patrones similares en datos de series de tiempo?

¿Cuáles son las implicaciones de privacidad del reconocimiento facial DeepFace de Facebook?

Web Analytics