¿Qué significa ‘estimación ML o MAP no captura la incertidumbre de los parámetros’?

Como resultado de una probabilidad máxima o un procedimiento a posteriori máximo, obtiene un valor único para su parámetro (tenga en cuenta que su parámetro podría ser un vector en un espacio de alta dimensión, el punto aún se aplica).

Debido a que solo obtiene un punto, no tiene idea de cuál es la distribución de los valores de los parámetros dados los datos, por lo tanto, no puede cuantificar razonablemente qué tan seguro está de que su parámetro es una buena estimación. Por ejemplo, si le pregunto cuál es la probabilidad de que su parámetro [math] \ theta [/ math] satisfaga [math] \ theta \ in (\ theta – x, \ theta + x) [/ math] (donde x tiene la misma dimensión que theta y la suma está bien definida), si solo tiene una estimación puntual, no puede responder. ¡Si tiene la distribución posterior, en cambio, puede responder fácilmente!

Tenga en cuenta que esto no significa que la estimación ML o la estimación MAP sean procedimientos incorrectos. El MLE, por ejemplo, cuando existe y es único, es un estimador asintóticamente eficiente, por lo tanto, si tiene muchos datos, es tan bueno como cualquiera. Sin embargo, si su objetivo es realizar una inferencia, podría ser bueno poder cuantificar la precisión de sus resultados proporcionando, por ejemplo, intervalos creíbles.

Machine Learning

Related Content

¿Cuál es la diferencia entre regresión, clasificación y agrupamiento en el aprendizaje automático?

¿Cuáles son algunos conjuntos de datos etiquetados disponibles públicamente que usan Kinect para su uso en la investigación de la visión por computadora?

¿Cuál es la diferencia entre los ingenuos Bayes y los algoritmos de máquina de vectores de soporte?

¿Cómo funciona el algoritmo EM para un modelo mixto que factoriza según un modelo Naive-Bayes?

Cómo construir un modelo de propensión a comprar para el marketing de bases de datos utilizando el aprendizaje automático en un entorno financiero

¿Cuál es la mayor cantidad de máquinas virtuales que ha visto en un servidor host o en el host?

¿Cuál es un buen algoritmo para la extracción de características y la detección de texto escrito a mano?

More Interesting

¿Es útil el modelo jerárquico bayesiano en la industria o las finanzas?

¿Es útil el aprendizaje automático en el campo de la ingeniería eléctrica?

Cómo elegir el conjunto de validación para poder representar mejor el conjunto de prueba

¿Cuáles son los grandes problemas en la inferencia variacional?

¿Cuáles son algunos trabajos de investigación que puedo publicar en el campo del procesamiento / generación de lenguaje natural, aprendizaje automático y minería de datos?

Cómo interpretar el resultado de una red totalmente convolucional

¿Puedo usar el concepto de aprendizaje automático para predecir cuánta cantidad de comida cocinar por día en un restaurante?

Cómo construir una aplicación de predicción de flujo de efectivo personal con extractos bancarios utilizando el aprendizaje automático

¿Qué es mejor para la detección de automóviles: Haar Cascade o HOG?

¿Cuáles son las aplicaciones más interesantes del aprendizaje automático en espacios inesperados?

¿Cuáles son los cursos necesarios para aprender la recuperación de información y el aprendizaje automático?

¿El parámetro C afecta a una clase SVM?

Después de la selección de características utilizando el método de rankeador, WEKA, el número de atributos en el conjunto de prueba es diferente del conjunto de entrenamiento. ¿Cómo los comparas?

¿Qué es la agrupación conceptual?

Debido a que este será el tema de un panel en el Instituto de Verano NBER, ¿qué puede aprender la economía de Data Science y / o Machine Learning, y qué puntos sobre este tema le gustaría ver incluidos?

Web Analytics