Si la tasa de predicción de un algoritmo de aprendizaje automático mantiene porcentajes bajos (50% a 60%) en un conjunto de datos, ¿cómo puedo mejorar?

Obtener baja precisión no es tan malo como parece, porque eso podría ser lo mejor que puede hacer de todos modos. Si su tasa de predicción es del 50%, entonces es tan bueno como un clasificador aleatorio (considerando 2 clases), es decir, no está ocurriendo aprendizaje. Puede haber diferentes ideas con las que puede jugar para mejorar la precisión:

  • Reemplace el clasificador lineal con uno no lineal. Por ejemplo, intente SVM con núcleo gaussiano en lugar de un núcleo lineal o regresión logística.
  • Pruebe los métodos de conjunto, es decir, en lugar de un árbol de decisión normal, utilice enfoques de bosque aleatorio o adaboost o aumento de gradiente.
  • Cambia tus características o su representación. A veces puede ser útil agregar nuevas funciones. También puede probar la selección de características, la transformación de características (por ejemplo, PCA, proyección aleatoria) o el aprendizaje de características (por ejemplo, Autoencoders, Redes de convolución)
  • Intente ajustar los parámetros o hiperparámetros del clasificador específico. Algunos de sus valores podrían ajustarse mejor a sus datos que otros.
  • Realice una limpieza de datos, elimine datos erróneos o ruidosos; esto puede ayudar a aprender mejores clasificadores.

HTH.

More Interesting

En la Bayes Net dada, ¿existe un caso de explicación del fenómeno?

¿Cómo se utiliza el aprendizaje automático en el análisis de sentimientos?

¿Dónde aprendo Machine Learning?

¿Necesita aprender CSE (motor de ciencias de la computación) para aprender inteligencia artificial, o hay cursos de ingeniería separados para IA y aprendizaje automático?

¿Cuál debería ser el plan adecuado para aprender el aprendizaje automático desde cero para un estudiante del tercer semestre?

¿Qué suele hacer que una red neuronal deje de mejorar temprano?

¿McKinsey consideró el crecimiento del software de Machine Learning al predecir la escasez de habilidades analíticas en el documento técnico de Big Data?

¿Cómo puede ayudar una formación en procesamiento de señales en una carrera en ciencia de datos?

¿Cuáles son algunos buenos tutoriales y códigos de aprendizaje profundo disponibles para problemas de clasificación binaria? ¿Es necesario tener una GPU para ejecutar el aprendizaje profundo y, de no ser así, de qué manera podemos llevarlo a cabo?

¿Cómo tratan SVM y ANN los valores atípicos?

¿Cuál es el papel de un neurocientífico en el desarrollo de inteligencia artificial?

¿Sigue siendo útil saber HTML hoy?

¿Cómo comenzaría con el cambio de funciones o el desarrollo de indicadores de funciones en mi empresa? Actualmente utilizamos ramificaciones.

¿Cuál es la diferencia entre Hidden Markov Chain y Markov Chain?

¿En qué situaciones, ha encontrado que el aprendizaje profundo no funciona bien?