Hay muy poco interés en las causas raíz cuando se realiza la minería de datos. Lo que queremos encontrar son estructuras de datos subyacentes que nos den información oculta en los datos. Lo que queremos es información, no explicación. No hay verificación que hacer tampoco. La información está disponible tal cual y es lo que es.
Por ejemplo, las reglas de asociación. Queremos encontrar qué elementos están asociados con los conjuntos de elementos. El conocimiento que queremos es cuán comunes son, si las asociaciones muestran un aumento del elemento cuando están en presencia del conjunto de datos, etc. La aplicación más conocida es el análisis de casos de cesta. ¿Qué tan común es la compra de leche? ¿Qué otro producto o productos aparecen en la misma compra? ¿La leche aumenta en presencia de mantequilla?
Queremos conocer estas asociaciones. Las causas fundamentales son, como mínimo, poco interesantes. La verificación es innecesaria.
- ¿Cuáles son los problemas de investigación en la detección de objetos?
- ¿Es posible utilizar el aprendizaje automático en la votación para que podamos incluir las razones de los votantes en lugar de sí / no?
- Cómo lidiar con una variable independiente categórica que tiene más de 500 variables en un problema de clasificación
- ¿Cómo puedo explicar el hecho de que el aprendizaje por transferencia ofrece un mejor rendimiento que el entrenamiento estándar?
- ¿Por qué mi modelo de regresión produce valores negativos para SalePrice en los datos de prueba?
Hay herramientas mucho mejores para lidiar con la causalidad. La experimentación es probablemente la mejor. El análisis, dependiendo del contexto y los datos disponibles es posible.