¿Cómo se asegura que el aprendizaje automático no aprenda la correlación cuando no hay causalidad, especialmente para la predicción?

Para las tareas de predicción, realmente no le importa si algo es o no un factor causal o no, solo que es un factor observable .

Si está tratando de predecir los ingresos de alguien, y sabe que es un fumador, lo cual determina que se correlaciona altamente con tener un ingreso más bajo, ¿hace una diferencia si fuman porque son pobres y fumar es un estrés asequible? calmante, o si son pobres porque gastan demasiado en cigarrillos? No, porque su capacidad predictiva es la misma de cualquier manera.

Ahora, podría afirmar que hay otros factores (no necesariamente causas) para fumar que deberíamos considerar. Por ejemplo, una persona rica con depresión puede fumar. En este caso, podemos introducir una nueva función para tener depresión (tal vez tengamos su historial de transacciones y podamos ver que compraron medicamentos para la depresión). Nuevamente, no necesitamos hacer ninguna determinación causal aquí (¿están fumando porque están deprimidos o deprimidos porque no pueden dejar de fumar?), Solo necesitamos saber que los factores están correlacionados.

Resulta que determinar realmente la causalidad es un problema muy difícil, pero afortunadamente no tenemos que preocuparnos por tareas simples de predicción.

¿Por qué querría asegurarse de que está aprendiendo causalidad en lugar de correlación?

Especialmente para la predicción, la correlación de aprendizaje te mantiene vivo, la causalidad de aprendizaje te da un sentimiento de conocimiento satisfecho de ti mismo mientras el tigre te está destripando.

Considere esta anécdota:

El piloto de autos de carrera está llegando a un giro a ciegas en la pista; en el último segundo, disminuye la velocidad con fuerza; Efectivamente, hay un desastre desordenado en la pista justo después del giro. Evitó estrellarse y posiblemente suicidarse, pero en ese momento no pudo explicar por qué disminuyó la velocidad.

Solo después de revisar la cinta de video se dio cuenta: la multitud no lo miraba conduciendo, las caras se volvieron para mirar el accidente después de la curva.

La correlación de aprendizaje fue predictiva y lo mantuvo vivo. La causalidad no era un problema.

More Interesting

¿Tiene sentido usar redes neuronales convolucionales en la identificación biométrica humana basada en ECG?

¿Por qué decimos que las redes neuronales simples no pueden manejar la entrada de longitud variable?

¿Cómo puede ayudar el conocimiento de un proceso estocástico, el movimiento browniano y un proceso de martingala con el aprendizaje profundo y la investigación del aprendizaje automático?

¿Crees que la tecnología 'block chain' es la próxima gran novedad en informática?

¿Por qué se usaría H2O.ai sobre la herramienta de aprendizaje automático scikit-learn?

¿Debo usar juicios de relevancia explícitos o comentarios de clics implícitos para recopilar datos de capacitación para construir un modelo de Aprendizaje para clasificar?

¿Cuál es una mejor opción para que un graduado de negocios aprenda en términos de su carrera, ciencia de datos o aprendizaje automático?

En el muestreo de importancia, ¿cuál es la diferencia entre [matemáticas] p (x) [/ matemáticas] y [matemáticas] q (x) [/ matemáticas]?

En el aprendizaje por refuerzo, ¿cuál es la diferencia entre una función de valor de estado V (s) y una función de valor de acción de estado Q (s, a)?

¿Cuál es el mejor software para Machine Learning y Deep Learning, de acuerdo con el tamaño del conjunto de datos y el sistema?

¿Qué es la regresión de cresta?

¿Cuáles son algunas técnicas de compresión que usan redes neuronales recurrentes?

¿Cuál es la diferencia entre lógica difusa y aprendizaje automático?

Cómo obtener un codificador automático de ruido para aprender una representación demasiado completa

¿Qué es el aprendizaje automático y sus diferencias con la inteligencia artificial?