¿Cómo lidiar con las tareas de aprendizaje automático con características correlacionadas?
Existen algunas técnicas que le permiten transformar sus datos en nuevas funciones que no están correlacionadas. Al igual que el análisis de componentes principales (que crea nuevas “variables” que no están correlacionadas).
También puede usar el coeficiente de correlación de Pearson para eliminar características altamente correlacionadas del conjunto de datos. Sin embargo, si su modelo tiene la capacidad de modelar relaciones no lineales entre los datos, tal vez esté mejor con algún coeficiente de correlación no lineal. Hay algunos como: Correlación máxima o el coeficiente de correlación de distancia menos conocido (pero no el peor) .
- ¿Cuáles son algunos proyectos que un estudiante de ciencias de la computación puede hacer en el semestre final en el campo de big data y análisis de datos?
- ¿Hasta qué punto son aplicables las leyes de privacidad de la UE, por ejemplo, el derecho al olvido, a las empresas que dependen de modelos personalizados de aprendizaje automático?
- ¿Cómo genera LinkedIn exactamente la lista de usuarios que "los espectadores de este perfil también vieron"?
- ¿Cuál es la diferencia entre datos e información en términos informáticos?
- ¿Una certificación de ciencia de datos es buena para una carrera?
También hay algunas técnicas que permiten seleccionar “automáticamente” las mejores variables (teóricamente) que permiten explicar la dependiente, sin embargo, debemos tener cuidado con los resultados y, sobre todo, con las opciones de datos que le damos a esas técnicas. Estoy hablando, por ejemplo, de regresión gradual.
Series temporales específicas
Puede usar SVM, redes neuronales y otras técnicas de “aprendizaje automático” en series temporales. No está limitado a los modelos AR.
Si preprocesa las series de tiempo de las acciones en ventanas y clasifica esas ventanas en “subir” y “bajar”, también puede usar técnicas de clasificación binaria para analizar los datos, usando los retrasos de las ventanas. Pero no los modelos AR.