Con el debido respeto a los otros respondedores, quienes mencionan cosas importantes a considerar al abordar un problema, sus respuestas son engañosas.
La realidad es que no puedes estar seguro de que no estás analizando algo que terminará sin sentido .
De hecho, es importante que analice las cosas que terminan sin sentido. Así es como se determina si son relevantes o no para su problema. Determinar que una determinada variable no es relevante para su problema a veces es tan valioso como saber qué es relevante, particularmente cuando esa determinación es contraintuitiva.
- ¿Qué sugerencias le daría Roman Trusov a una persona que acaba de ingresar a ML?
- ¿Cuáles son algunos buenos métodos para el procesamiento previo de datos en el aprendizaje automático?
- ¿Qué significa 'regresión' en estadística y aprendizaje automático?
- ¿Cuál es un buen conjunto de datos de Kaggle para practicar el ajuste de modelos de regresión logística o modelos jerárquicos?
- ¿Cuál es el mejor lenguaje de programación para implementar algoritmos de aprendizaje automático?
Suponga que está vendiendo un producto de consumo costoso, por ejemplo, un teléfono inteligente insignia que cuesta $ 900. Desea saber qué predice mejor la probabilidad de compra de un cliente. Sus conclusiones pueden informar el contenido publicitario, las asociaciones minoristas, la colocación y orientación de anuncios, etc.
Dado que su producto cuesta $ 900, es muy probable que las personas dentro de su organización ya hayan hecho suposiciones sobre su cliente objetivo. Pueden suponer que tiene mayores ingresos, tiene un puntaje de crédito más alto, vive en ciertas áreas acomodadas o en las principales ciudades metropolitanas, etc. [Probablemente también supongan que él es un él.]
Si pasa mucho tiempo analizando estos factores y encuentra poca evidencia de que sean predictores significativos de compras, es una gran victoria . Te has topado con una conclusión contraintuitiva que contradice las suposiciones de que las personas dentro de la organización ya pueden estar actuando.
No estás haciendo análisis en el vacío … o al menos no deberías hacerlo. Siempre estás haciendo análisis dentro de un contexto particular. Determinar qué no es relevante y por qué, dentro de su contexto particular, es fundamental para formular la pregunta correctamente.
También quisiera señalar que el análisis exploratorio de datos no le ayuda a evitar analizar cosas que no tienen sentido . El análisis exploratorio de datos es análisis . Algunas de las otras respuestas parecen implicar que el análisis exploratorio de datos es como un aperitivo que viene antes del plato principal (presumiblemente modelado, prueba de hipótesis, etc.). Sin embargo, en muchos escenarios del mundo real, la parte más importante del análisis será explorar los datos y utilizar la comprensión que se obtiene para enmarcar el problema correctamente.