¿Debería haber una relación específica entre el número de características y el número de clases? Si tengo 15 funciones pero 50 clases con 1000 datos de entrenamiento, ¿tendré un problema de sobreajuste? ¿Y cuál es la mejor técnica de clasificación para esta relación?

La proporción necesaria es aquella entre el número de ejemplos ( no características ) para cada clase.

El sobreajuste ocurre cuando un modelo aprende detalles irrelevantes y ruido en los datos de entrenamiento, lo que afecta su capacidad de generalización en nuevos datos que pueden no tener ese ruido. En base a esto, creo que es más probable que se produzca un sobreajuste a medida que aumenta el número de características.

La base de la clasificación son las características distintivas. Lo importante es que hay al menos una característica que es capaz de identificar claramente las diferentes clases. De hecho, es por eso que existen técnicas de reducción de dimensionalidad como PCA, LDA, etc. donde en el caso de PCA, el objetivo es reducir el conjunto de características a aquellas que proporcionan la máxima variación para evitar la maldición de la dimensionalidad . Por lo tanto, cuanto menos características distintivas, mejor.

En cuanto a la elección de la técnica de clasificación, en primer lugar, ¿son todas esas características realmente importantes? Quizás, intentar aplicar PCA puede ayudar a reducir la dimensionalidad. Pero lo más importante, la elección del algoritmo de clasificación realmente no depende de la relación de características a clases. Quizás, si tiene restricciones de memoria, entonces un árbol de decisión no será una buena opción, ya que necesitará mucha memoria para contener las diferentes ramas.

Aprendizaje automáticoAprendizaje profundoAprendizaje supervisadoClasificación

¿Los matemáticos trabajan en problemas que surgen de la inteligencia artificial (teórica) y el aprendizaje automático?

¿Cuántas personas en el mundo son expertos en aprendizaje profundo para visión por computadora?

¿Cuáles son los trabajos más gratificantes para quienes desean trabajar en el aprendizaje profundo?

¿El aprendizaje por refuerzo con redes neuronales profundas implica descenso de gradiente y propagación hacia atrás?

¿Son los chatbots el comienzo de la verdadera IA?

¿Cuál es la diferencia entre CNN y RNN?

Lamento no poder contarte más, pero depende de tus datos. Una forma estándar de ver si está sobreajustando su modelo o no es separar sus datos en un conjunto de entrenamiento (digamos 800 de ellos) y un conjunto de prueba (los 200 restantes) que no utilizará para optimizar. Cuando traza la precisión de su clasificador a lo largo de los pasos de entrenamiento, verá un sobreajuste cuando la precisión en el conjunto de entrenamiento seguirá mejorando, pero que la del conjunto de prueba comenzará a disminuir.

En cuanto a la técnica, si su característica no está correlacionada, puede usar el forrest aleatorio, si es así, SVM son eficientes. Nuevamente, eso depende de su aporte.

Darius Afchar

More Interesting

¿Qué es el condicionamiento en el aprendizaje seq2seq?

Cómo construir la matriz del núcleo para un polinomio de grado finito

¿Debo abandonar mi programa de doctorado CS para estudiar por mi cuenta?

Análisis de conglomerados: ¿Cuáles son algunas posibles medidas de distancias / diferencias para variables binarias?

¿Cuál es el proceso de reconocimiento de voz (en resumen)?

¿Cuáles son las principales conferencias sobre inteligencia artificial, procesamiento del lenguaje natural y aprendizaje automático?

¿Cuáles son algunos trabajos de investigación recientes sobre detección de anomalías?

¿Cree en los resultados producidos por el análisis de control metabólico (modelado matemático utilizando parámetros cinéticos)?

Al aplicar redes neuronales para la clasificación binaria, ¿hay algún beneficio para el conjunto de entrenamiento que tiene un número igual de 0 y 1?

¿Cuál es la diferencia entre redes neuronales y de creencias?