Cómo probar la idoneidad de diferentes funciones del núcleo en un proceso gaussiano (GP) en el modelado de una función

Sí, comparar las probabilidades marginales es un enfoque basado en principios para decidir el mejor núcleo. Como señala Laurent, la validación cruzada es otra opción.

Me gustaría citar un párrafo de Procesos gaussianos para el aprendizaje automático , por Rasmussen & Williams, aquí:

Al comparar la pseudo-probabilidad de la metodología de validación LOO-Cross con la probabilidad marginal de la sección anterior, es interesante preguntar bajo qué circunstancias podría ser preferible cada método. … Sin embargo, es interesante notar que la probabilidad marginal nos dice la probabilidad de las observaciones dadas las suposiciones del modelo . Esto contrasta con el valor frecuente de LOO-CV que proporciona una estimación de la probabilidad predictiva (log), de si se pueden cumplir o no los supuestos del modelo. Así Wahba [1990, sec. 4.8] ha argumentado que los procedimientos de CV deberían ser más sólidos frente a la especificación errónea del modelo.

Si la muestra no es demasiado grande, mi método favorito consiste en utilizar la validación cruzada. Entonces observaría la calidad de la estimación del error, la puntuación z …

Esto le daría la mejor indicación de la calidad de su proceso gaussiano.

Sin embargo, si una gran cantidad de ajuste fuera imposible por falta de tiempo, creo que la mejor opción sería comparar la probabilidad marginal.

More Interesting

¿Pueden los algoritmos de aprendizaje profundo predecir los resultados de los partidos deportivos?

¿Qué universidades de la India son buenas para realizar investigaciones en el aprendizaje por refuerzo?

¿No tener datos temporales en el vector de entrada hace que un RNN-LSTM sea inútil en comparación con otros NN si su salida es una secuencia temporal?

¿Dónde puedo encontrar una biblioteca pública de algoritmos de aprendizaje automático (ML) y aprendizaje profundo (DL) con muestras?

¿Las implementaciones físicas de las redes neuronales son claramente preferibles a las GPU?

¿Es el curso de aprendizaje automático de Andrew Ng en Coursera una versión simplificada del curso CS 229: aprendizaje automático que enseñó en Stanford?

¿Puedo usar la agrupación (k-means, etc.) en un gran conjunto de datos para automatizar el proceso de búsqueda de similitudes y hacer recomendaciones?

¿Siri es una forma de aprendizaje automático?

Como principiante en el procesamiento del lenguaje natural, ¿desde dónde debo comenzar?

¿Cuál es la mejor manera de manejar un modelo multitarea si las etiquetas de datos de capacitación tienen NA, es decir, no se analizaron todas las muestras para todas las tareas?

¿Qué tan bueno es UMass Amherst para CS, especialmente para el aprendizaje automático y la minería de texto?

Cómo saber si, durante el entrenamiento de un modelo de aprendizaje profundo, está en camino de encontrar un mínimo local mejor o no

¿Por qué PCA y LDA se usan juntas en el reconocimiento facial?

¿Cuál es la diferencia entre la anotación automática de imágenes y la recuperación de imágenes?

¿Cuáles son algunos proyectos que puedo hacer mientras aprendo aprendizaje automático?