El parámetro [math] l [/ math] en PLS es análogo al número de componentes en PCA.
En el mundo de la quimiometría, existe una heurística común para seleccionar el número de componentes ([matemática] l [/ matemática]).
1) Comience con [matemáticas] l = 1 [/ matemáticas]
2) Calcule [matemática] R ^ 2 [/ matemática] y una [matemática] R ^ 2 [/ matemática] con validación cruzada (llamada [matemática] Q ^ 2 [/ matemática]). Si [matemáticas] R ^ 2 [/ matemáticas] está en un nivel satisfactorio, deténgase.
3) De lo contrario, incremente [matemática] l [/ matemática] hasta que [matemática] R ^ 2 [/ matemática] alcance un nivel de varianza satisfactorio explicado (típicamente 0.8 o más), o hasta que la [matemática] Q ^ 2 [/ matemática ] número comienza a disminuir.
- ¿Son las redes de tipo neuronal el único juego real en la ciudad o podemos desarrollar máquinas sofisticadas de IA que no piensen como los humanos?
- En los Estados Unidos, ¿es ilegal entrenar redes neuronales usando imágenes con derechos de autor?
- ¿Cuánto cuesta una máquina de crioterapia?
- ¿Cómo son convexos los métodos del núcleo?
- ¿Cuál es una forma intuitiva de explicar los resultados de la PCA?
([matemática] Q ^ 2 [/ matemática] no aumenta monotónicamente como [matemática] R ^ 2 [/ matemática] – a menudo alcanzará un pico)
En teoría, se supone que la [matemática] Q ^ 2 [/ matemática] representa la “bondad de la predicción”, y en este contexto, se supone que protege contra el sobreajuste. Pero en la práctica, tiene limitaciones severas.
¡Cuidado con q2! [Modelo de gráfico J Mol. 2002]
No estoy necesariamente respaldando el enfoque anterior, sino simplemente proporcionando un punto de datos en cuanto a una práctica estándar que he encontrado.