¿Cuál es la diferencia entre ‘Inferencia’ y ‘Estimación del modelo’ en los documentos de LA?

Creo que esta es realmente una línea muy fina, y encontrarás muchas personas que dirían que no hay diferencia. Aquí hay algunas pautas que pueden ayudarlo a comprender la diferencia.

Variables locales versus variables globales: en muchos modelos hay variables ‘locales’ y parámetros del modelo ‘globales’. Las variables locales están asociadas a cada punto de datos, mientras que los parámetros globales controlan el comportamiento de todo el modelo, globalmente.
Por ejemplo, en un modelo oculto de Markov (HMM), las variables locales serían la secuencia de estado oculta, mientras que los parámetros globales serían la matriz de probabilidad de transición y las probabilidades de emisión. En los modelos mixtos, las variables indicadoras de asignación de grupo (a qué grupo pertenece cada punto de datos) serían las variables locales, mientras que las medias de grupo serían parámetros globales. Normalmente dice que deduce el valor de las variables locales y aprende los parámetros globales.

Integración versus optimización: al menos en terminología bayesiana, la inferencia generalmente significa determinar un posterior completo sobre una variable, o integrarlo, la estimación del modelo o el aprendizaje se refiere a optimizar el valor de un parámetro del modelo.

Diferentes niveles de jerarquía: muy a menudo cuando trabaja con un modelo probabilístico jerárquico que involucra múltiples niveles de variables aleatorias organizadas en una jerarquía, luego determinar el valor (o una distribución posterior sobre) las variables en las capas inferior / media se conoce como inferencia , mientras que la determinación del valor de los parámetros en la parte superior de la jerarquía se conoce como estimación de modelo o aprendizaje.

More Interesting

¿Qué es la divergencia contrastante?

Supongamos que reuní a todos los usuarios de Twitter que escribieron tweets con las palabras "aprendizaje automático" en ellos (durante el último mes, por ejemplo), y luego construí un gráfico de red basado en sus seguidores. Además de las diversas medidas de centralidad, ¿qué otras técnicas podría utilizar para identificar a las mejores personas a seguir? ¿Cómo lo hace Klout?

¿Qué título debo tomar para entrar en la investigación de Deep Learning? (Graduado de CS)

¿Qué hace una capa convolucional 1 × 1?

¿Cuál puede ser un buen problema de investigación computacional para trabajar con el conjunto de datos de Wikipedia?

¿Qué idioma debo usar para tensorflow?

¿Qué tamaño debería tener mi bosque aleatorio aproximadamente si tengo 17 variables y medio millón de registros?

¿Cuál es la forma estándar de ordenar contenidos en función de la función o consulta del usuario?

¿Qué piensan los pequeños equipos de ciencia de datos sobre la plataforma Dato y el pensamiento de Carlos Guestrin detrás de la democratización del aprendizaje automático?

¿Por qué las computadoras no pueden superar de manera confiable a los humanos en reconocimiento facial?

¿Dónde puedo encontrar un conjunto de datos satelitales espaciales?

¿Cómo decidimos la clase de clústeres generados a través del clúster k-means?

¿Cómo detectamos el sobreajuste y la falta de ajuste en Machine Learning?

¿Qué técnicas de aprendizaje automático debo usar para estratificar y spofing?

¿Es el sesgo entre las mejores universidades frente a otras universidades en los Estados Unidos tan malo como el sesgo de IIT frente al resto de la India?