Las variables categóricas pueden funcionar bien con la regresión si se ordenan naturalmente en un sentido significativo.
Por ejemplo: en los EE. UU., A menudo las personas reciben calificaciones de letras A, B, C, D y luego los promedios de calificaciones se calculan haciendo A = 4, B = 3, C = 2, D = 1. Tenga en cuenta que un GPA es una media aritmética y, por lo tanto, una regresión trivial con solo la intercepción.
Somos capaces (o nos permitimos; podría ser trabajo cuestionar por qué C es dos veces D, pero A es solo un 33% mejor que B) porque esperamos que los mismos factores que diferencian a un estudiante C de un estudiante D (digamos, cantidad de horas estudiadas) también diferencian a un estudiante B de un estudiante C y así sucesivamente.
- ¿Crees que Big Data está creando nuevos modelos de negocio o simplemente cambia la forma en que trabajamos?
- En la compresión de datos, ¿cómo ayuda la mejora de la SNR a aumentar la tasa?
- Soy un estudiante de biología / psicología, pero quiero entrar en ciencia de datos y aprendizaje automático. Soy un senior, así que no estoy en condiciones de volver a declarar mi especialidad. ¿Cuál sería una buena pista para mí aprender sobre ciencia de datos y programación, y eventualmente conseguir un trabajo en investigación / programación?
- ¿Qué programas / certificados cortos me recomiendan sobre Machine Learning, Big Data, AI y campos relacionados?
- ¿Hay alguna forma de descargar los datos de Quora para analizar?
(En un nivel algo filosófico, todos los regresores continuos son categóricos ponderados, no solo el coeficiente intelectual y las puntuaciones de depresión / manía y cosas similares, sino también índices económicos, donde las canastas de diferentes productos se ponderan por precio, o continuos discretizados, como mediciones físicas) .