Antes de utilizar los procesos gaussianos, tiene dos preguntas principales: “¿su conjunto de datos es razonablemente pequeño?” (Menos de 1,000 está bien) y “¿tiene una buena idea sobre cómo se relacionan las etiquetas de dos puntos?”, Por ejemplo, si sabe f ( 1) = 2, ¿tienes alguna buena intuición sobre lo que te hace pensar que f (4) es? Esto es crucial para elegir una función de covarianza razonable. (aunque incluso si no lo hace, conectar y cargar datos en un GP para algún núcleo estándar como RBF no le cuesta mucho, ¡así que vea lo que sucede de todos modos!).
Es útil cuando desea una medida de incertidumbre sobre sus predicciones en lugar de solo una estimación puntual. Si su pregunta es “cuál es mi mejor conjetura para f (4)”, elija un enfoque computacionalmente más fácil, pero si desea “¿qué tan seguro estoy de que mi conjetura para f (4) solo está desactivada en 0.5”, entonces Procesos Gaussianos puede ser el modelo para ti.
Por ejemplo, si desea hacer una regresión lineal y solo le importa la estimación puntual “y = ax + b”, ¡NO USE GP! Utilice la regresión lineal … por eso existe. Pero si desea un pdf sobre los posibles valores de f (4) para que pueda responder preguntas más complejas (por ejemplo, “¿cuál es la probabilidad de que f (4) esté entre 2 y 7”), entonces un proceso gaussiano con un núcleo lineal sería tener sentido.
- ¿Cuáles son los fundamentos programáticos del procesamiento del lenguaje natural?
- Cómo comparar el rendimiento de mis modelos de Deep Learning con puntos de referencia estándar cuando se utiliza el aumento de conjunto de datos
- ¿Qué es este aprendizaje automático y big data?
- ¿Cuáles son algunos casos de uso para el aprendizaje automático en realidad virtual?
- ¿Cómo le enseñas a un robot que ha cometido un error?
Los procesos gaussianos tienen dos usos principales que se me ocurren aparte de las tareas de aprendizaje automático supervisadas “típicas”:
- Cuadratura bayesiana (es decir, aproximando la integral de f (x))
- Optimización (es decir, encontrar el máximo o mínimo de f (x))
En ambos casos, a menudo funciona bien, pero solo se debe usar si evaluar “f (x)” es costoso; si “f (x)” es fácil de evaluar, use otra cosa porque (como se señaló anteriormente) los procesos gaussianos no ‘ No funciona bien con un gran número de puntos. Además, si puede tomar una derivada, algo de sabor de descenso de gradiente podría ser mejor para usted que la optimización bayesiana.
Si bien los procesos gaussianos ciertamente se usan en el aprendizaje automático supervisado, los ejemplos anteriores son un poco menos conocidos (por ejemplo, probablemente no se tratan en un curso introductorio de aprendizaje automático), así que pensé en compartirlos.