Aplicación de la estimación de máxima verosimilitud
Por lo general, seguimos tres pasos en MLE para encontrar la estimación de un parámetro.
Paso 1: Haga una suposición sobre la función de generación de datos.
- ¿Cuál es el mejor enfoque para construir un sistema de clasificación basado en la clasificación de otros?
- ¿Por qué las variedades son importantes para el aprendizaje profundo o el aprendizaje de refuerzo profundo?
- Dada una red de aprendizaje profundo, ¿se puede entrenar para enseñar (por ejemplo, resolviendo la secuencia óptima de ejemplos o lo que sea) otra red? Si es así, ¿se puede resolver este problema (enseñanza) utilizando técnicas de aprendizaje profundo?
- Cómo discriminar una señal del ruido en la última investigación y desarrollo de AI / ML
- ¿Es un SVM o un clasificador MaxEnt apropiado para este escenario de clasificación de texto y por qué?
Paso 2: Formule la función de probabilidad para los datos utilizando la función de generación de datos. La función de probabilidad no es más que la probabilidad de observar estos datos dados los parámetros ([matemática] P (D | \ theta) [/ matemática]). Los parámetros dependen de nuestros supuestos y de la función de generación de datos.
Paso 3: Encuentre un estimador para el parámetro usando la técnica de optimización. Encuentre la estimación que maximiza la función de probabilidad. Esta es la razón, el nombre del estimador calculado usando MLE es M-estimator.
Aplicación 1: Lanzamos una moneda n veces y observamos k cabezas. Aquí, consideramos que la cabeza es un éxito y la cola es un fracaso.
Paso 1: La suposición es que la moneda sigue la función de distribución de Bernoulli.
Paso 2: La función de probabilidad es la función de distribución binomial ([matemática] P (D | \ theta) [/ matemática]) en este caso. Necesitamos encontrar la mejor estimación para p (Probabilidad de obtener cabeza) dado que k de n lanzamientos son Cabezas.
Paso 3: el estimador M es
[matemáticas] \ hat {P} = \ dfrac {k} {n} \ tag {1} [/ matemáticas]
Aplicación 2: regresión lineal
Paso 1 : Los supuestos de la función de generación de datos es https://www.quora.com/What-is-an… y la función de generación de datos es función de densidad de probabilidad condicional ([math] f_y (Y | X) [/ math] ), que sigue la distribución normal.
Paso 2 : Si el tamaño de los datos es N, entonces la función de probabilidad es la suma del producto de N función de densidad de probabilidad condicional. Necesitamos encontrar la estimación de los parámetros del modelo de regresión lineal. Los parámetros son \ beta, \ sigma.
Paso 3 : el estimador M para los parámetros es
[matemáticas] \ hat {\ beta} = (X ^ {T} X) ^ {- 1} X ^ {T} Y \ tag {2} [/ matemáticas]
[math] \ sigma_ {est} = \ sqrt {\ frac {\ sum (Y- \ hat {Y}) ^ {2}} {N}} \ tag {3} [/ math]
Aplicación 3 : Regresión logística