¿Cuáles son los algoritmos que se pueden usar en R para la predicción de datos categóricos?

Esta es una pregunta muy importante para resolver problemas de ciencia de datos y completar proyectos en estos días. Bueno, las matemáticas no tienen respuestas para datos categóricos. Primero debe convertirlo a representación numérica o factor. Hay tantas funciones en R para hacer eso. “As.factor ()” es un ejemplo. En algunos modelos, puede hacerlo haciendo “type = class”.

Y sobre algoritmos, no está arreglado. Desde mi experiencia, diría que SVM funciona bastante bien para la clasificación categórica. Además, “bosque aleatorio”, “árboles de decisión” y “clasificadores de aumento de gradiente” son muy poderosos para la clasificación. Pero, le sugiero que realice el preprocesamiento antes de crear cualquier modelo inferencial. Haga PCA para verificar el equilibrio de sesgo-varianza, reduzca las dimensiones de los datos si es posible. Pruebe la validación cruzada utilizando el paquete “caret” con diferentes algoritmos en su conjunto de entrenamiento. Luego seleccione el mejor algoritmo para probar su conjunto de datos.

Personalmente por experiencia, prefiero usar SVM para la clasificación categórica si el conjunto de datos es pequeño. Los bosques aleatorios y los árboles de decisión son muy poderosos para la clasificación en conjuntos de datos grandes y medianos por su fuerte estructura relacional y jerárquica. Por supuesto, hay muchos otros algos, así que sigue cavando y prueba cosas diferentes en el conjunto de datos. Esa es la única forma “inherente” de aprender ciencia de datos.

La regresión logística se puede usar para predecir la salida binomial categórica (Verdadero o Falso) y la regresión logística multinomial si su salida tiene más de dos datos categóricos (por ejemplo, Bajo, Medio y Alto).

Hay muchos modelos que se pueden usar para predecir un resultado categórico. Solo en el paquete CAREt 200+ modelos están disponibles.

El paquete caret

Es mejor limitar su búsqueda y luego buscar una metodología.

Espero que sea de ayuda.