¿Cuál es la diferencia entre gaussiano y bayesiano?

Gaussian y Bayesian están en diferentes dominios, por así decirlo, a pesar de que cada uno está unido a una persona famosa.

Carl Friedrich Gauss hizo muchas contribuciones, y el nombre Gaussian se usa para referirse a la distribución normal. Si un modelador dice “gaussiano”, entonces el significado es que se supone que algunas variables aleatorias tienen distribuciones normales.

Thomas Bayes fue un clérigo que produjo el teorema de Bayes. Es una declaración simple sobre probabilidades condicionales, pero el uso del teorema de Bayes divide el mundo estadístico en dos modos diferentes de operaciones. Hemos llegado a usar “Bayesiano” para significar que el análisis se realizó a través de distribuciones anteriores y actualizado a través del teorema de Bayes. La escuela opuesta, las estadísticas frecuentistas, no utiliza distribuciones previas. Acepte esto como una distinción superficial muy rápida; El tema es muy amplio y muy profundo.

Una persona que usa métodos bayesianos podría llamarse “un bayesiano”. No puedo imaginar ningún contexto en el que alguien sea llamado “gaussiano”.

Supongo que probablemente quisiste decir “¿Cuál es la diferencia entre un frequentista y un bayesiano?” Estas dos palabras se refieren a diferentes filosofías de probabilidad, mientras que “gaussiano” se refiere a una función de distribución de probabilidad que ambos pueden usar y utilizan.

Piense en cualquier proceso del mundo real que tome algunas entradas (sus valores pueden ser conocidos, parcialmente conocidos o desconocidos) y, en base a lo que pueden ser mecanismos inciertos, produce un resultado medible. Si hay alguna de las incertidumbres que mencioné, esos resultados no pueden predecirse y, por lo tanto, se consideran “aleatorios”. Los adherentes a ambas filosofías tratarán de asignar probabilidades a los diversos resultados posibles, pero tal vez de diferentes maneras.

Un frecuentista separará ciertas partes de todo el procedimiento de lo incierto e intentará asignar probabilidades al conjunto que es incierto. La palabra “frecuentista” no significa, como muchos afirmarán, que esta persona defina estas probabilidades como las frecuencias de ocurrencia después de infinitas pruebas de este conjunto. Nadie ha repetido nunca un proceso infinitamente. Significa que la persona espera que la repetición, si se puede realizar, produzca una frecuencia que tenga el mismo valor que la probabilidad. Por supuesto, puede ser difícil hacer esta separación.

Un bayesiano tratará todo el procedimiento, tanto cierto como incierto, por lo que se sabe al respecto. Esencialmente, “adivinará” las habilidades basadas en su mejor conocimiento. Esta suposición se llama un “previo”. Si las pruebas repetidas en el mismo conjunto de circunstancias demuestran una frecuencia diferente, Bayesain utilizará la fórmula desarrollada por Thomas Bayes para “actualizar” antes de formar una nueva distribución que incorpore el conocimiento adquirido por las pruebas.

Los bayesianos a menudo ridiculizarán a aquellos que consideran frecuentes, pero el ridículo es infundado. Las dos filosofías abordan los problemas de manera diferente, y el ridículo se basa en hacerlo incorrectamente.

Ejemplo: supongamos que saco un cuarto de mi bolsillo y le digo que, estadísticamente, me he demostrado a mí mismo que voltearlo es parcial. Pero no le digo cuán sesgada es, o qué resultado se ve favorecido. ¿Cuál es la probabilidad, si lo volteo una vez por ti, de obtener cabezas?

Un posible enfoque frecuente dice que el sesgo es desconocido, por lo que la pregunta no se puede responder. El enfoque bayesiano dice que el conocimiento que tenemos no incluye nada para favorecer a Heads over Tails, por lo que según nuestro conocimiento, cada posibilidad tiene una probabilidad del 50%. Aunque sabemos que esta moneda está sesgada, esto es correcto para el lanzamiento de una moneda.

Este bayesiano ridiculizará el enfoque frequentista que describí (La probabilidad está en la mente), ya que no puede producir una respuesta. Pero tendrá la misma dificultad si la pregunta se cambia a “¿Cuál es la probabilidad de que dos resultados consecutivos sean iguales?”

El enfoque correcto frecuente de la pregunta original incluye la elección de la moneda como parte del proceso. Esto esencialmente trata el conjunto completo de monedas sesgadas como una población de la que elegimos. Si desea repetir el experimento como debería hacerlo un Frequentist, necesita una moneda diferente cada vez. Ambas filosofías dicen que no hay razón para creer que toda la población de monedas favorece un resultado sobre el otro, por lo que la probabilidad de que una Cara en una moneda seleccionada al azar (sesgada o no) sea del 50%.

Esto es solo un juego de palabras, similar a “¿Cuál es la diferencia entre Bayesian y Markovian?”. De hecho, me sorprende que esta pregunta tenga tantos seguidores.

Un proceso gaussiano es un tipo particular de proceso estocástico de tiempo continuo, en el que cualquier segmento tiene una distribución Normal (ver Proceso gaussiano) en Wikipedia.

No existe un proceso estocástico estándar llamado “Bayesiano”.

More Interesting

Cómo medir el rendimiento de aprendizaje en Q-Learning

¿Prediciendo compras (en comercio electrónico) a través de modelos estadísticos o de aprendizaje automático?

En el autoencoder variacional, ¿por qué solo tomamos muestras de variables latentes de un gaussiano estándar y aplicamos el decodificador para generar nuevos datos en las pruebas?

¿Es posible darle a una computadora millones de imágenes de varios objetos, y se da cuenta de que hay cosas como animales, platos de cocina, montañas, etc. sin que nosotros lo digamos, y cómo se hace esto exactamente?

¿Cuáles son los principales puntos de regresión?

¿Existe alguna implementación de aprendizaje profundo de respuesta basada en la recuperación de preguntas?

¿Cuáles son los temas candentes en el aprendizaje automático y la lógica difusa juntos?

¿Hay algún resumen de las mejores modelos para el premio de Netflix? ¿Cuáles son las ideas de alto nivel e intuitivas detrás de los modelos ganadores que finalmente fueron utilizados en el aprendizaje conjunto por los mejores equipos?

¿Cuál es el tamaño mínimo de corpus para entrenar incrustaciones de palabras?

Cómo justificar el rendimiento de un modelo de aprendizaje profundo personalizado (CNN)

¿Por qué TF (frecuencia de término) a veces da mejores puntuaciones F que TF-IDF para la clasificación de texto?

Cómo aprender a crear un sistema óptico de reconocimiento de caracteres utilizando redes neuronales artificiales como mi mini proyecto

¿Cuántos datos necesitamos para pensar siquiera en aplicar el aprendizaje profundo?

¿Cuál es un buen conjunto de datos para probar mi clasificador vecino más cercano K?

¿Qué debo hacer para que los cursos de aprendizaje automático sean más divertidos y pospongan las cosas?