¿Cómo sobreajustar el clasificador de aprendizaje automático? ¿Y cuál debo usar?

Utilice una red neuronal grande (NN), especialmente una red neuronal profunda (DNN) sin regularización y entrénela durante mucho más tiempo de lo habitual. El DNN simplemente memorizará todos y cada uno de los ejemplos de entrenamiento, por lo tanto, alcanzará un 100% de precisión en el conjunto de entrenamiento.

La regla general para sobreajustar cualquier modelo es simplemente memorizar los datos de entrenamiento. Eso se puede lograr mediante:

  1. Asegurarse de que la capacidad del modelo sea lo suficientemente grande como para memorizar los datos de entrenamiento. En las máquinas de vectores de soporte (SVM), puede aumentar la capacidad utilizando núcleos más sofisticados.
  2. Capacitar a los modelos mucho más tiempo porque la detención temprana tiene cualidades de regularización y la regularización es lo último que necesitamos si el objetivo es sobreajustar un modelo.

Memorizar los ejemplos de entrenamiento se llama aprendizaje vago. Por lo tanto, los estudiantes perezosos básicos como el clasificador vecino k-vecino más cercano (kNN) con k = 1 también es una buena manera de sobreajustar los datos de entrenamiento.

Entonces puedes usar

  1. NNs
  2. SVM
  3. Clasificadores KNN

Todo lo cual puede sufrir fácilmente de sobreajuste.

Aunque no estoy exactamente seguro de por qué querrías sobreajustar tu modelo porque en ML, la generalización es muy importante.

Espero que esto ayude.

No escuches al tipo que dijo redes neuronales, es mucho más fácil que eso.

El tipo que sugirió al vecino más cercano tiene razón, pero a veces los vecinos más cercanos son realmente muy, muy lentos.

Simplemente use un árbol de decisión con min_samples_leaf = 1.

Ve con el vecino más cercano. Excepto en los casos en que los mismos atributos se correlacionan con diferentes etiquetas (o conjunto de etiquetas), esto le dará una precisión del 100% en el conjunto de trenes.

Esto es equivalente a simplemente obtener el documento de preguntas y las claves de respuestas antes de un examen y reproducir fielmente las claves de respuestas en el examen.

Para sobreajustar drásticamente los datos en una regresión con 3 dimensiones, intentaría masajearlos en polinomios de 5º grado dentro de una regresión multinomial.

Para una tarea de clasificación, el sobreajuste al 100% de precisión en el conjunto de entrenamiento es tan fácil como crear un árbol de decisión sin profundidad máxima.

More Interesting

¿Se acerca el segundo invierno de IA?

¿Mi trabajo será relevante en 10 años?

Cómo comenzar a aprender IA para las finanzas

¿Cuál crees que sería el futuro? cyborgs, inteligencia artificial u otra cosa?

¿Qué puede hacer un estudiante universitario en un laboratorio de aprendizaje automático y minería de datos?

Inteligencia artificial: ¿Qué tan útil es la computación distribuida para construir IA?

¿Cuál sería el impacto en el mundo si la inteligencia artificial se volviera común en cada dispositivo y computadora?

¿Cuánto le pagan por la investigación (especialmente la investigación de IA y la investigación matemática)? ¿Es una buena carrera?

¿Cómo se podrían aplicar las técnicas de aprendizaje automático a la arquitectura informática?

¿Cómo impactará el aprendizaje automático, la IA y la minería de datos en el futuro?

¿Cuándo AI / ML podrá componer música para dar una respuesta emocional específica, basada en el conectoma del oyente? ¿Cómo sonaría esta música?

¿Cómo puede un bebé aprender a caminar sin resolver conscientemente un problema de control dinámico?

¿Qué modelo de red neuronal es eficiente para la predicción del mercado de valores mediante el análisis de sentimientos? ¿Y qué herramienta / biblioteca usar?

¿Es posible para una máquina inteligente de Inteligencia Artificial componer música hoy que no se puede distinguir de una escrita por un humano?

¿El aumento de los robots sexuales impulsados ​​por IA conducirá a una subpoblación mundial masiva?