Cómo evaluar los mejores resultados posibles para un clasificador SVM

Los resultados de la búsqueda en la cuadrícula le muestran si sus resultados aún pueden mejorarse o no. Por ejemplo, cuando ajusto los parámetros de un clasificador SVM, primero empiezo con la elección del núcleo. Cuando veo que un kernel cuadrático funciona mejor que su contraparte lineal, verifico si un kernel cúbico logra un rendimiento aún mejor. Si este no es el caso, se puede inferir razonablemente que un núcleo cuadrático es la mejor opción para el conjunto de datos dado. Posteriormente, utilizo el mismo enfoque para el parámetro de compensación C. Desde mi experiencia personal, este enfoque hace un buen trabajo al ajustar los parámetros.

Sin embargo, al optimizar su algoritmo para los datos disponibles, debe tener en cuenta dos cosas:

  1. Sobreajuste: Lograr el mejor resultado posible para los datos disponibles no significa que haya encontrado el mejor algoritmo. La idea del aprendizaje automático es poder predecir la clase de nuevas instancias. Cuando los algoritmos se sobreajustan, han inferido demasiado de los datos disponibles, lo que significa que es menos probable que predigan la clase de nuevas instancias correctamente (aquí se explica una explicación más detallada de este problema: ¿Qué es el sobreajuste?).
  2. Complejidad computacional: a menudo, los algoritmos sofisticados solo funcionan un poco mejor, incluso si requieren mucho más tiempo para ser entrenados. ¿Vale la pena el aumento del porcentaje de instancias correctamente clasificadas del 90,1% al 90,3% del tiempo extra que se necesita para entrenar al clasificador?

El problema del sobreajuste y la complejidad computacional muestran que el ajuste de parámetros produce compensaciones. Cuando desee saber si se requiere una mayor optimización de los parámetros, puede ser útil hacerse las siguientes preguntas:

¿Cuál es el propósito del algoritmo? ¿Está clasificando correctamente tantas instancias como sea posible o tiene una alta tasa de recuperación para la primera clase?
¿Un ajuste adicional ayuda al algoritmo a mejorar en esta tarea? ¿La elección actual de parámetros permite entrenar el algoritmo en un tiempo razonable?

More Interesting

¿Cuántos datos necesitamos para pensar siquiera en aplicar el aprendizaje profundo?

¿Por qué los científicos no definen la inteligencia de tal manera que pueda implementarse artificialmente en un software, como si pudiéramos crear luz artificialmente?

¿Qué debo hacer para que los cursos de aprendizaje automático sean más divertidos y pospongan las cosas?

¿Cómo funcionan los aceleradores de procesador?

¿Puede un fármaco ser estadísticamente efectivo para toda la población, pero estadísticamente no es efectivo para todas las subpoblaciones (como hombres y mujeres) por separado?

¿Cuáles son las mejores prácticas cuando se utiliza el análisis predictivo para la industria? ¿Hay algunos marcos o pautas?

¿Puedo usar el concepto de aprendizaje automático para predecir cuánta cantidad de comida cocinar por día en un restaurante?

¿Podría el aprendizaje automático erradicar el cáncer?

¿Cómo puede ayudar el conocimiento de un proceso estocástico, el movimiento browniano y un proceso de martingala con el aprendizaje profundo y la investigación del aprendizaje automático?

¿Cuál es una buena puntuación porcentual en los problemas de conocimiento de Kaggle para principiantes?

¿Cuál es el mejor curso para especializarse en inteligencia artificial y aprendizaje automático?

¿Cuáles son algunos ejemplos de inteligencia artificial en sitios web?

¿Qué enfoques utilizas para vectorizar funciones en Matlab?

¿Es cierto que las redes neuronales son más rápidas en las mujeres?

¿Es el análisis de sentimientos todo sobre lingüística?