El “parámetro de escala del núcleo” se llama “gamma” en LibSVM. Considere el núcleo gaussiano: k (x, y) = exp (-gamma * (xy) ^ 2). Si gamma es grande, entonces este núcleo se caerá rápidamente a medida que el punto y se aleje de x. A medida que disminuye gamma, el grano se caerá cada vez menos rápido. Cuando gamma es 0, el núcleo será el mismo (= 1) para todos los puntos y independientemente de dónde esté y en el espacio de características.
En esta interpretación, gamma está relacionado con la extensión de sus puntos de datos. Si están muy lejos el uno del otro (lo que sucedería en un espacio dimensional muy alto, por ejemplo), entonces no desea que el núcleo se caiga rápidamente, por lo que usaría una pequeña gamma. Por lo tanto, libSVM utiliza un valor predeterminado de 1 / num_features.
En cuanto a cómo configurarlo, la respuesta tendrá que ser validación cruzada.
- ¿Un pequeño porcentaje de datos incorrectos (digamos entre 1% y 5%) en el conjunto de datos de entrenamiento impacta significativamente la efectividad del entrenamiento de una red neuronal?
- ¿Es cierto que las Redes Adversarias Generativas (GAN) aprenden la función de pérdida automáticamente, y si es así, cómo?
- ¿Qué proyectos principales puedo hacer en R después de aprender minería de datos, análisis de sentimientos de limpieza, regresión y técnicas de agrupamiento?
- ¿Cuál es la diferencia entre gaussiano y bayesiano?
- ¿Necesito un título universitario para trabajar en el aprendizaje automático?