En primer lugar, supongo que te refieres a correlación en lugar de covarianza. Porque la covarianza no es adimensional y depende de las unidades. Por ejemplo, si usa centímetros en lugar de metros, sus valores de covarianza serán más altos. La correlación es normalizada y sin dimensiones.
Y la respuesta es no, no siempre se pueden eliminar las funciones correlacionadas. Debido a que las combinaciones de esas características pueden ser significativas para su tarea, incluso si cada una de ellas no es muy útil y están correlacionadas. A continuación se muestra un ejemplo común:
- ¿Qué es la minería de datos? Como se hace
- ¿Puedo convertirme en un analista de datos sin una calificación en estadística o matemáticas como especialidad?
- ¿Vale la pena hacer el Programa de Diploma de Postgrado en Ciencia de Datos de Manipal Global Academy of Data Science?
- ¿Cuál es el extremo superior absoluto que puede ganar un científico de datos?
- ¿Qué opinas de Numerai?
Como puede ver, las características dadas en los ejes xey están altamente correlacionadas. Pero su combinación lineal (xy) es muy útil en la clasificación en este ejemplo. Por supuesto, este es un caso extremo y no creo que se puedan ver ejemplos tan claros muy a menudo en problemas del mundo real. Aún así, la posibilidad de obtener información de características correlacionadas no se ignora generalmente y se emplean varias técnicas de selección de características o reducción de dimensionalidad (como PCA), en lugar de simplemente descartar características basadas en la correlación.