Puede usar una de las dos técnicas de uso común para tratar con variables categóricas:
- One-Hot Encoding – Convierte una variable con N clases en N variables separadas con etiquetas binarias. Repita para cada una de las 3 variables.
- Codificación de etiquetas: asigna variables categóricas a enteros.
La codificación de etiquetas funciona solo si hay un orden inherente en las variables. Las variables como estas se llaman ordinales . El ejemplo sería una variable como los días de la semana. El lunes puede ser un 1, el martes puede ser 2 y así sucesivamente. Aquí el clasificador supondría que 2 es mayor que 1 de alguna manera, lo cual está bien ya que hay algún orden en la variable.
Una codificación activa es para el caso en que las variables no son ordinales, como los nombres de lugares. Esto también se usa mucho en el procesamiento del lenguaje natural.
- ¿Cuál es la mejor GPU que se utilizará para Deep Learning con presupuesto (> 400 $)?
- ¿En qué casos tengo que usar un entorno distribuido y en qué casos no?
- Como principiante en el procesamiento del lenguaje natural, ¿desde dónde debo comenzar?
- ¿Cómo cambiará la TPU de Google el mercado de CPU + GPU? ¿Cómo responderán los fabricantes de chips a este cambio?
- ¿Tiene sentido la regularización (L2, abandono, etc.) alguna vez para datos muy ruidosos, pero también abundantes, como series de tiempo financieras?
Debería leer más sobre estos métodos. Ambos tienen sus usos y son necesarios para que funcionen clasificadores como la regresión logística. Ambos se implementan fácilmente en Python y R.