¿Qué algoritmo de aprendizaje automático es el mejor para clasificar más de 40 clases?

Aquí hay un consejo general, cuando tiene 500 funciones, tiene al menos [matemática] 2 ^ {500} = 3 * 10 ^ {150} [/ matemática] (suponiendo que sean simplemente binarias, peor si no lo son) posibles enumeraciones para sus datos. Eso es MUCHO más que las muestras que tienes (ver Maldición de dimensionalidad). Es posible que no vea suficientes datos de entrenamiento por combinación de características, y simplemente puede sobreajustar. Básicamente, su algoritmo de clasificación elegirá un combo de características en particular como el ‘tell’ de cada punto en particular y lo clasificará correctamente.

Le recomiendo que realice un preprocesamiento, por ejemplo, puede usar PCA para reducir la dimensionalidad, o simplemente analizar la correlación entre las características y ver si puede eliminar aquellas que contienen información redundante.

La elección de su algoritmo de clasificación viene más tarde y depende realmente de la estructura de su problema. En general, los bosques aleatorios con impulso, SVM y redes neuronales son algoritmos de ‘caja negra’ que puedes probar. Pero nunca es aconsejable utilizar un método sin comprender realmente si se aplica bien a su caso.

Related Content

¿Debería considerarse el paso de preparación / preprocesamiento de datos una parte de la ingeniería de características? ¿Por qué o por qué no?

Aparte de NPTEL, ¿qué es bueno para la preparación de GATE para CS?

¿Cuál es el mejor software para CAD?

¿Por qué el tamaño de RAM en un sistema siempre es menor que el tamaño del disco duro? ¿Por qué las RAM no están disponibles en los módulos de memoria más grandes?

¿Cómo es tomar 6.004 (estructuras de cómputo) en el MIT?

¿Qué es un estudio de emociones en Facebook?

¿Cuáles son algunas de las aplicaciones del aprendizaje automático en análisis de publicidad en línea?

En la clase de Máquinas de vectores de soporte, puede intentar usar la Máquina de vectores de soporte gemelo que es adecuada para conjuntos de datos no balanceados. Aquí está el documento: @Twin admite máquinas de vectores para la clasificación de patrones

Para la clasificación multiclase, los enfoques habituales son one-v / s-rest o one-v / s-one, aunque un enfoque más efectivo podría ser el uso de códigos de corrección de errores: @ [cs / 9501101] Solución de problemas de aprendizaje multiclase mediante salida de corrección de errores Códigos

Yuval Feinstein

Sugerencia de Ryan Rifkin en Clasificación de múltiples clases: use clasificadores binarios regualrizados fuertes (SVM, RLSC) y luego use clasificadores N (Uno contra todos -OVA) o N (N-1) clasificadores (Todos contra todos – AVA) y calcule el resultados individuales

Yuval Feinstein

Esto dependerá en gran medida de

1) Tamaño de sus datos
2) Número y tipo de características
3) Velocidad de entrenamiento necesaria
4) Velocidad de clasificación necesaria
5) Si los datos necesitan ser entrenados en línea o fuera de línea
6) Si necesita el algoritmo en paralelo u otras restricciones similares

Su pregunta es muy general para tener una respuesta correcta.

Yuval Feinstein

More Interesting

¿Ha pasado una computadora la prueba de Turing, desde el punto de vista matemático y de la informática?

¿Hay alguna señal de que un archivo ha sido comprimido? ¿Cuántos tipos diferentes de compresión de archivos hay y qué tan diferentes son?

¿Cuánto pagan los informáticos recién graduados, específicamente en el estado de Nueva York?

Cómo limpiar mi computadora de todo

Cómo convertir -302 de decimal a hexadecimal

¿Son 6 meses suficientes para aprender el reconocimiento de imágenes de aprendizaje automático?

¿Qué es el almacenamiento?

¿Pueden los científicos de datos reemplazar a los analistas de negocios?

¿Qué determina cuánta memoria puede almacenar una computadora?

¿Cómo funcionan las redes de transformadores espaciales?

¿En qué áreas podemos aprovechar los proyectos IOT con minería de datos?

¿Cuál es la mejor GPU para fines de aprendizaje automático?

Cómo diseñar una máquina de Turing que acepte una cadena de longitud impar

¿Qué compañías en India están usando AngularJS en la producción?

En Tensorflow, si uso sigmoid_cross_entropy_loss, ¿cómo puedo calcular la etiqueta que estoy prediciendo? (No puedo usar tf.argmax como en softmax_cross_entropy).

Web Analytics