¿Cuál es la diferencia entre regresión lineal y logística?

TL; DR

La regresión lineal se usa para predecir variables continuas.

La regresión logística se usa para predecir variables categóricas (principalmente binarias)

La regresión lineal genera el valor de la variable como su predicción

La regresión logística genera la PROBABILIDAD de ocurrencia de un evento como su predicción

La precisión y la bondad de ajuste de la regresión lineal se pueden medir por pérdida, R al cuadrado, R al cuadrado ajustado, etc.

Regresión logística: medir la precisión de las distribuciones categóricas puede ser complicado debido al desequilibrio. Entonces, tenemos que usar un montón de métricas para medir el ajuste del modelo. Algunos de ellos son –

Precisión, precisión, recuperación, puntuación F1 (media armónica de precisión y recuperación), curva ROC (para determinar el umbral de probabilidad para la clasificación), matriz de confusión, concordancia, Gini y la lista continúa …

Además de esto, se pueden hacer muchas otras comparaciones. He tratado de mantenerlo “amigable para los practicantes”.

Quizás, primero deberías pensar en términos de variables. Aquí hay una clasificación:

1) Las variables nominales son variables que tienen dos o más categorías, pero que no tienen un orden intrínseco.

2) Las variables dicotómicas son variables nominales que tienen solo dos categorías o niveles. Es un tipo de variable nominal, es decir, binaria sin orden. Ejemplo: género, “masculino” y “femenino”.

3) Las variables ordinales son variables que tienen dos o más categorías, que tienen un orden intrínseco, es decir, puede clasificarlas. Sin embargo, las distancias entre los rangos no están claras. Ejemplo: bajo riesgo, riesgo medio y alto riesgo.

4) Las variables de intervalo son variables ordinales con una distancia clara entre los rangos pero sin origen fijo. Ejemplo, la temperatura.

5) Las variables de relación son variables de intervalo centradas en 0, es decir, origen fijo. Ejemplo: altura, peso donde sus valores en 0 significan que no hay variable allí.

Por ejemplo, en la regresión logística tendría un caso de variables dicotómicas o cualquier otra variable categórica (= variable discreta). La regresión lineal se usa con variables continuas, como ya señalaron otros contribuyentes.

Debo señalar que el término “regresión” proviene de la declaración “Regresión hacia la media”, atribuida a Francis Galton, quien era el primo medio de Charles Darwin.

Puede combinar ambas variables, como señalé en otra publicación (por ejemplo, usando Modelos Lineales Generalizados (GLM)):

La respuesta de Raúl Machado a ¿Es aconsejable realizar una regresión lineal cuando los datos son una mezcla de valores categóricos y numéricos?

El médico examina los síntomas de su enfermedad y luego diagnostica una enfermedad. Está utilizando los resultados de la regresión logística que su cerebro ha aprendido durante un período de tiempo observando a sus pacientes.

El médico observa los números de varias pruebas realizadas en usted y decide la dosis de un medicamento. Eso es aprovechar los resultados de una regresión lineal.

More Interesting

En la optimización matemática, ¿por qué alguien usaría el descenso de gradiente para una función convexa? ¿Por qué no encontrarían simplemente la derivada de esta función y buscarían el mínimo de la manera tradicional?

¿Para qué se utiliza el aprendizaje automático?

¿Cómo debo seguir el curso de Andrew NG si quiero aprender el aprendizaje automático en Python y cómo debo progresar después de completar el curso?

¿Qué significa 'regresión' en estadística y aprendizaje automático?

¿Ha publicado Factual.com algún trabajo de investigación (o algún asunto técnico importante) sobre las técnicas de aprendizaje automático que utilizan para rastrear y extraer de la web?

Cómo llegar a un problema de aprendizaje automático para un proyecto personal

¿Qué condiciones se deben cumplir para que el tiempo de ejecución se acelere al usar GPU para redes neuronales (NN)?

¿Cómo se recupera la información de las cajas negras?

¿Qué tecnologías que no son de IBM se están utilizando para mejorar el ecosistema de IBM Watson?

¿Cuál es el mejor curso para IA?

¿Por qué y cuándo subestima 'varianza de Bayes variacional de campo'?

¿Cuál es la diferencia entre un vector de pensamiento y un vector de omisión de pensamiento?

Cómo explicar el desempeño de un modelo predictivo a la gerencia que no conoce el aprendizaje automático

¿Qué es el procesamiento de señales y cómo se relaciona con el aprendizaje automático?

Cómo encontrar la correlación más fuerte entre los vectores de colores a continuación en MATLAB o Python