¿Qué representa el término sesgo en la regresión logística?

Desde la página de Wikipedia sobre regresión logística:

En la regresión logística, se supone que los predictores tienen una relación lineal con las probabilidades de registro del resultado de “éxito”. Por ejemplo, si [math] \ beta_1 [/ math] en la ecuación anterior es 3, entonces las probabilidades de registro aumentarían en 3 (en promedio) por cada aumento en 1 unidad de [math] x_1 [/ math].

Para ver qué representa el término de sesgo [math] \ beta_0 [/ math], simplemente establezca todas [math] x_i [/ ​​math] en 0. El odds log resultante es el término de sesgo. En otras palabras, el término sesgo es la probabilidad de registro “predeterminada” para el caso de que todos los predictores sean iguales a 0 (o igual al valor de referencia para predictores categóricos).

Por ejemplo, si [math] \ beta_0 [/ math] = 2.5, entonces las probabilidades de registro del resultado son 2.5. Esto es un poco difícil de interpretar, así que lo que podríamos hacer es convertir las probabilidades de registro en probabilidades (o más en probabilidad). La probabilidad es [matemática] exp (2.5) = 12.18 [/ matemática], es decir, el resultado de “éxito” es 12.18 veces más probable que el resultado de “falla”, si todos los predictores son iguales a 0.

El papel del sesgo es el mismo en un NN. Vea la excelente respuesta de Nate Kohl aquí.

Lo único que agregaría a la respuesta de Okiriza Wibisono es que creo que “sesgo” es un mal nombre para este término. Es la intercepción.

More Interesting

¿Cómo puede Machine Learning ayudar a un desarrollador de Android?

Cómo construir una aplicación de Android orientada al aprendizaje automático

¿Cuál es un ejemplo numérico para el algoritmo de análisis de componentes principales (PCA)?

¿Qué es la estimación de máxima verosimilitud?

¿Qué enfoque de aprendizaje automático recomendaría realizar OCR (reconocimiento de caracteres) en un sistema de reconocimiento automático de matrículas?

¿Puedo usar el concepto de aprendizaje automático para predecir cuánta cantidad de comida cocinar por día en un restaurante?

¿Qué tan significativo es el artículo de FractalNet?

¿Qué es el procesamiento de señales y cómo se relaciona con el aprendizaje automático?

¿Cuáles son algunos de los mejores programas de posgrado de aprendizaje automático que no requieren un título universitario de CS?

¿Qué condiciones se deben cumplir para que el tiempo de ejecución se acelere al usar GPU para redes neuronales (NN)?

¿La red neuronal convolucional (CNN) tiene que ver con la arquitectura de red y factores como la tasa de aprendizaje, la función de pérdida utilizada, etc.

¿Cómo puedo probar el método de regresión lineal?

¿Cuáles son las industrias que probablemente se verán afectadas por el aprendizaje profundo?

¿Por qué la regresión logística es generalmente resistente al sobreajuste en el aprendizaje automático?

¿Cuál es el mejor enfoque e implementación para la detección y reconocimiento de objetos en la actualidad?