¿Cómo podemos estimar múltiples parámetros de un clasificador?

Depende de cuál sea tu clasificador. La respuesta típica a una pregunta de este tipo es la validación cruzada (validación cruzada (estadísticas)). Dividiría mis datos en 2 partes (90% para capacitación, 10% para pruebas) y lo haría 10 veces (validación cruzada 10 veces) para un rango de valores de parámetros y luego elija el mejor parámetro. Scikit learn tiene una validación cruzada incorporada (3.1. Validación cruzada: evaluación del rendimiento del estimador) para facilitarle la vida.

Por lo general, seguiría y haría una búsqueda de cuadrícula (tratar de definir un tamaño de cuadrícula razonable) e intentar encontrar una región estable en el espacio de parámetros en lugar de los mejores parámetros de rendimiento. Las regiones estables en el espacio de parámetros generalmente se generalizan bien fuera de los puntos de muestra y muestran un comportamiento menos errático.

Si quieres ponerte elegante, puedes configurar un problema de optimización genética para encontrar el mejor conjunto de parámetros. Tenga en cuenta que los algoritmos genéticos tardan un tiempo (a veces toma mucho tiempo) en converger, pero generalmente deberían funcionar mejor que la validación cruzada, especialmente si la cuadrícula definida para la búsqueda no es muy buena. Sugeriría elegir un paquete GA abierto en lugar de implementarlo.

Mientras realiza el ajuste de parámetros, tenga en cuenta el sobreajuste.

Related Content

¿Qué es el aprendizaje automático y la IA?

¿Qué campos están siendo afectados por el progreso de la investigación en el procesamiento del lenguaje natural?

Cómo elegir un algoritmo de aprendizaje automático

¿Cuál es la relación entre el aprendizaje automático y la minería de datos?

¿Cuál es la diferencia entre un clasificador Naive Bayes y AODE?

Cómo construir un modelo de regresión lineal en el aprendizaje automático

¿Qué parte de la investigación de aprendizaje profundo es empírica versus teórica?

More Interesting

¿Cuáles son los componentes básicos del reconocimiento de voz desde el punto de vista DSP?

¿Cuáles son algunos puntos de referencia significativos descubiertos para el equilibrio de la máquina? (específicamente: clasificación, segmentación y desarrollos de sensores)

¿En qué dominios encuentra aplicación la tecnología de procesamiento de eventos complejos (CEP)?

¿Cuáles son las 3 mejores GPU, independientemente del precio del aprendizaje profundo, especialmente si necesitamos mucha RAM de GPU, así como cálculos de alto rendimiento / velocidad?

Al predecir un resultado binario, ¿cómo toman en cuenta las personas el orden en que ocurren las entradas?

¿Cómo se puede hacer la experimentación de aprendizaje profundo en una PC en casa?

Cómo desarrollar una aplicación que reproduzca música de acuerdo a tu estado de ánimo

¿Cuál es la tasa de error de trama (FER) en las tareas de reconocimiento de voz?

¿Cuándo es preferible usar árboles de regresión en el aprendizaje automático?

¿Cuáles son las instituciones en India que ofrecen cursos de aprendizaje automático y minería de datos y cuáles son las áreas posteriores?

¿Cómo puede llevar a cabo experimentos y compararlos con otros algoritmos en la investigación de la visión por computadora (detección de objetos, reconocimiento, seguimiento, etc.)?

Dada una red de aprendizaje profundo, ¿se puede entrenar para enseñar (por ejemplo, resolviendo la secuencia óptima de ejemplos o lo que sea) otra red? Si es así, ¿se puede resolver este problema (enseñanza) utilizando técnicas de aprendizaje profundo?

¿Cuál es la diferencia entre el sistema de soporte de decisiones y el sistema de recomendaciones?

¿Puedo usar una CPU para generar datos (aumento) cuando el entrenamiento de flujo de tensor en GPU es de forma paralela?

¿Qué son las máquinas complejas?

Web Analytics