¿Podemos agregar la capa SVM como capa inferior en la arquitectura CNN para una mejor clasificación?

Si por “capa inferior”, quiere decir que el final está completamente conectado más tarde, entonces sí puede. De hecho, he hecho esto varias veces, por una razón principal: junto con las predicciones de la clase, puedo obtener puntajes de confianza bastante confiables, en los que puedo establecer un umbral para obtener esencialmente una clase de “Ninguno”.

La forma en que uso el SVM es simple. Primero, entreno la CNN con la conexión completa más tarde, como lo hago normalmente. Después de eso, ejecuto todos mis vectores de entrenamiento a través de la CNN y extraigo el vector justo antes de la capa completamente conectada. Luego uso esos vectores como mis vectores de entrada para entrenar mi SVM.

Entonces, para cualquier imagen nueva, la ejecuto a través de CNN, extraigo el vector antes de la capa completamente conectada y lo ejecuto a través de mi clasificador SVM para obtener una predicción de clase y un puntaje de confianza

Puedes usar este enlace, quizás útil.

Siempre puedes poner tu clasificador en cualquier clasificador auxiliar de clase baja

More Interesting

¿Qué es el procesamiento del lenguaje natural en términos simples?

Cómo construir y ejecutar mi primera red de aprendizaje profundo

¿Cómo soluciona un máximo A posterior el problema de sobreajuste en una estimación de máxima verosimilitud?

Redes neuronales artificiales: ¿Hebbian Learning rige el trabajo en problemas de aprendizaje automático o es solo un enfoque teórico?

¿Qué tecnologías existen actualmente para hacer matemáticas en grandes conjuntos de datos?

¿Cuáles son algunos ejemplos de buenos regresores e instrumentos para los modelos de regresión IV?

¿Cuáles son las diferencias entre un científico de aprendizaje automático y un científico de datos?

¿Es posible detectar una estructura de acordes en una canción usando el aprendizaje profundo? Si es así, ¿cómo?

Ciencias de la computación: ¿Cuáles son los pros y los contras de utilizar el modelado de procesos gaussianos para la regresión?

¿Existe una brecha entre las estadísticas y las comunidades de aprendizaje automático? Si es así, ¿por qué?

¿En qué se diferencia el estado oculto (h) de la memoria (c) en una celda LSTM?

En Python, ¿cómo puedo probar y asegurarme de que mi modelo predice datos correctamente? (principiante preguntando)

Cómo implementar un nuevo clasificador desde cero utilizando el enfoque de aprendizaje automático

¿Cuál es la tasa de error de trama (FER) en las tareas de reconocimiento de voz?

¿Por qué las redes neuronales recurrentes no pueden ampliarse bien?