Puede usar KNN convirtiendo los valores categóricos en números.
Pero no está claro que debas hacerlo . Si las categorías son binarias, entonces codificarlas como 0–1 probablemente esté bien. Pero tan pronto como obtienes más de dos categorías, las cosas se vuelven problemáticas. Si los valores son “Bajo”, “Intermedio” y “Alto” (o más generalmente, si al menos tienen un orden natural), puede volver a codificarlos numéricamente como 1, 2, 3. Pero si los valores son “Rojo”, “Verde”, “Azul” (o más generalmente, algo que no tiene un orden intrínseco), luego simplemente codificarlos como enteros no funcionará. Una posibilidad en el caso es colocarlos igualmente espaciados alrededor de un círculo, ya que la distancia entre cualquier par de ellos es la misma. Con los valores [math] N> 3 [/ math], es posible que desee colocarlos en los vértices de un símplex regular en [math] N [/ math] -dimensional space. En otras palabras, codifíquelos como (1,0, …, 0), (0,1,0, …, 0), …, (0, 0, .., 0, 1). Entonces la distancia entre cualquier par de valores es la misma.
La clave para pensar es exactamente “¿cuál es la definición apropiada de distancia para mis datos?” Por definición, KNN usa distancias euclidianas. Dependiendo de la estructura de su combinación de datos numéricos y categóricos, esto puede o no ser razonable. Si terminas decidiendo que alguna otra noción de distancia tiene más sentido (por ejemplo, algo así como la distancia de Jaccard si todos tus datos son realmente binarios), entonces deberías mirar “particionando alrededor de medoides” (PAM) en lugar de KNN.
- ¿Qué métricas debo usar para evaluar un modelo generativo cuantitativamente y qué tan confiables son?
- ¿Cuál es la biblioteca de aprendizaje profundo más fácil de aprender?
- ¿Cuáles son los casos de uso (existentes o futuros) en los que el uso de la Red Adversaria Generativa es particularmente interesante?
- ¿Cuáles son los mejores libros de aprendizaje automático para principiantes?
- ¿Cuáles son algunos de los requisitos previos necesarios para aprender el aprendizaje automático o la inteligencia artificial?