¿Hay algún ejemplo en la inferencia bayesiana de que, incluso con infinitos puntos de datos, el efecto de lo anterior no puede ser “eliminado”?

Si [math] p (x) [/ math] es su previo y [math] D [/ math] es la información observada, entonces de acuerdo con la regla del producto [math] p (x | D) \ propto p (D | x) p (x) [/ matemáticas]. Esta es la inferencia bayesiana estándar en la variable aleatoria desconocida [matemáticas] x [/ matemáticas].

De ello se deduce que si [math] p (x) [/ math] es cero en algunos lugares, no importa cuán ” fuertes ” sean los datos ([math] p (D | x) [/ math]), [ matemáticas] p (x | D) [/ matemáticas] seguirá siendo cero en esos mismos lugares. Esto es lo que otro respondedor llamó un “prior dogmático”. Sin embargo, otro respondedor dio la función delta de Dirac como un ejemplo especial de esto.

La moraleja de la historia es asegurarse de que haya una masa de probabilidad distinta de cero para todos los posibles / razonables [matemática] x [/ matemática] para que, al menos en el límite, los datos puedan determinar la estimación [matemática] p (x | D) [/ matemáticas].

Aprendizaje automáticoEstadísticaInferencia bayesianaPregunta de existencia

Related Content

¿Cómo entrenamos un clasificador para el cual solo tenemos: 1) un conjunto de datos que son datos de entrenamiento explícitamente positivos y 2) un conjunto de datos que se desconoce (tiene el potencial de ser positivo o negativo)?

Data Science, Big Data, Machine Learning, ¿qué certificación debo hacer para cambiar la trayectoria profesional desde un entorno de control de calidad?

¿Cómo afectará el aprendizaje automático al mundo para 2030?

Cómo saber cuándo usar el aprendizaje automático y cuándo no

¿Es el curso de aprendizaje automático de Andrew Ng en Coursera una versión simplificada del curso CS 229: aprendizaje automático que enseñó en Stanford?

¿Cuáles son algunas buenas aplicaciones o scripts que prueban muchas técnicas de aprendizaje automático a la vez para problemas de predicción?

¿Cómo determinaría si el error de cuando ejecuta su algoritmo de aprendizaje automático es de alto sesgo o alta varianza (también conocido como corte o sobreajuste)?

He visto algo en Wikipedia que se parece a esto, pero no sé los detalles:
Teorema de Bernstein-von Mises
(ver Limitaciones)

James McInerney

More Interesting

¿Qué significa el impulso en las redes neuronales?

¿A qué laboratorio puedo unirme en Caltech para hacer investigación de aprendizaje automático?

¿La ingeniería de características es relevante para los bosques aleatorios? ¿Cómo son relevantes las transformaciones de centrado, escala y Box-Cox en este contexto?

¿Qué modo de Anaconda se debe usar para los algoritmos de aprendizaje automático?

¿Cuáles son actualmente los temas candentes en la investigación de aprendizaje automático y en aplicaciones reales?

¿Alguna vez ha utilizado el aprendizaje automático de alguna manera para ayudar en las pruebas de software y la automatización de pruebas?

Si existieran interfaces neuronales, ¿cuáles serían las aplicaciones civiles? ¿Cuántos tendría, por qué?

¿Qué sitio web ofrece 'filtrado colaborativo como servicio'?

¿Quiénes son los mejores ingenieros de aprendizaje automático?

¿Existen trabajos de Ciencia de datos y Aprendizaje automático para estudiantes de primer año en India?

¿Qué empresas del área legal usan Machine Learning?

Aprendizaje automático: ¿es el enfoque descrito a continuación una buena forma de evaluar la calidad de las recomendaciones basadas en comentarios implícitos?

¿Cuál es la diferencia entre la regularización y el sesgo inductivo en el aprendizaje automático?

¿Cuál es la mejor manera de predecir una clase +/- en un escenario de aprendizaje automático donde tengo k características trinarias y un conjunto de datos del orden de cientos o miles?

Cómo saber qué algoritmo usar y cuándo

Web Analytics