¿Qué máquina es mejor para clasificar imágenes, SVM u otra? ¿Por qué?

Para clasificar imágenes, podría decirse que el estado actual de la técnica son las redes neuronales convolucionales (CNN), como lo sugiere @Martin Krämer de manera similar.
Si quiere probarlo, le sugiero que pruebe los paquetes de código abierto desarrollados por el grupo de visión Berkeley en Caffe | Marco de aprendizaje profundo. Proporcionó buenos tutoriales (tanto para instalación, compilación y uso) como demostraciones que le permiten jugar con AlexNet / GoogLeNet pre-entrenados, los cuales son CNN famosos para los desafíos de ImageNet que implican clasificar 1000 categorías de imágenes. .
¡Puede aplicar directamente su red capacitada a su problema simplemente ajustándolos en sus propios datos! Creo que lo disfrutarás una vez que lo ejecutes. De hecho, también me interesa saber por qué quieres clasificar las imágenes. Si es solo uno de los proyectos de su curso, creo que Caffe es una buena opción, ya que es fácil decirlo y terminará dándole un buen clasificador (cercano al estado de la técnica) después de un ajuste fino . Pero si desea crear un producto, tal vez sea solo un punto de partida y necesite investigar más trucos y métodos para mejorarlo.
Por supuesto, ahora hay muchos trucos propuestos para mejorar aún más la red. Si está interesado, puede seguir leyendo algunos de estos documentos:
Ampliar el reconocimiento de imagen
Acelerar el entrenamiento de redes profundas al reducir el cambio interno de covariables
Superando el rendimiento a nivel humano en la clasificación de ImageNet
Estos tres documentos son publicados por Baidu, Google y MSRA, respectivamente, y son algunos de los últimos avances de CNN.
Finalmente, quiero recordarle que si desea ajustar bien la red, debe tener una gran cantidad de datos , de lo contrario, la CNN podría no funcionar tan bien como podría esperar. En este caso, le sugiero que use algunas de las salidas intermedias de la red como representaciones de características (demostraron ser muy expresivas) de sus imágenes y aplique el clasificador tradicional, como SVM, ya que entrenar la red con datos insuficientes es propenso a sobrepasarse. -adecuado.

More Interesting

¿Cuáles son las historias de éxito del aprendizaje profundo para el procesamiento del lenguaje natural y los marcos y bibliotecas utilizados o creados por ellos?

¿Cuál es la relación entre relevancia y aprendizaje automático?

Serie temporal: ¿Existe un enfoque para la detección de anomalías que no se base en datos de entrenamiento anteriores?

¿Vale la pena seguir una maestría en aprendizaje automático de NCSU? ¿Es una mejor opción solo por el triángulo de investigación?

¿Cuál es el papel de la informática en el aprendizaje automático?

¿Cuál es la diferencia entre gaussiano y bayesiano?

Cómo clasificar micro-textos (tweets, preguntas, etc.)

¿Es posible crear un filtro adaptativo usando una red neuronal para que después del entrenamiento pueda filtrar la señal ruidosa y dar la salida deseada?

¿Cuánto del aprendizaje automático es en realidad solo optimización?

¿Se puede extraer información significativa de datos hash para el aprendizaje automático?

Aprendizaje automático: ¿qué significa 'Los bosques aleatorios requieren casi ninguna preparación de entrada'?

¿Cómo comienzo en la teoría y la programación del aprendizaje automático?

¿Hay algo que Deep Learning nunca podrá aprender?

¿Cómo soluciona un bosque aleatorio los problemas de regresión (no normalidad, heterocedasticidad, multicolinealidad, valores atípicos, valores faltantes y variables categóricas)?

¿Cuál es la mejor manera de manejar un modelo multitarea si las etiquetas de datos de capacitación tienen NA, es decir, no se analizaron todas las muestras para todas las tareas?