Primero, simplemente trazaría las dos variables en un diagrama de dispersión para ver si su idea es factible de alguna manera.
La correlación de rango de un Spearman medirá la correlación entre densidad y temperatura.
Me parece que es probable que sus datos sean continuos (o lo suficientemente cercanos a continuos) y no discretos. Si realmente son discretos (es decir, en pocas categorías con muchos “lazos”), entonces podría ser útil algún tipo de prueba de chi cuadrado para la tendencia o un modelo de regresión.
- ¿Qué universidades de EE. UU. Son buenas y tienen un curso de maestría en big data o análisis de datos?
- Como empresa de tecnología, ¿Amazon usa más Python que R para proyectos de Data Science?
- ¿Qué clasificadores de aprendizaje automático escalan muy bien a big data? ¿Hay alguna referencia de papel?
- ¿Qué asignaturas optativas de Matemáticas / Estadísticas son las mejores para obtener una buena base para el análisis de datos en Australia?
- ¿Cuáles son los proyectos de ciencia de datos más interesantes en Quora?
Sin embargo, Andrew Gough tiene razón en que cualquier correlación puede ser falsa.
Afortunadamente, tenemos un marco que nos ayuda a determinar si es probable que sea así o no. Los criterios de Bradford Hill se desarrollaron hace mucho tiempo en medicina, pero se pueden aplicar a cualquier situación en la que desee considerar si es probable que una correlación sea causal.
Hay nueve criterios criterios de Bradford Hill. Puede que no todos sean relevantes para usted, pero en resumen, debe tener en cuenta:
- Si hay otro mecanismo de confusión o sesgo de selección que podría haber llevado a la correlación que vio.
- Si tiene un mecanismo plausible para su correlación
- Si existe evidencia paralela de un efecto similar trabajando en otro lugar
- Qué tan fuerte es su correlación y si se ajusta a lo que esperaba de su modelo