¿Qué máquina es mejor para clasificar imágenes, SVM u otra? ¿Por qué?

Para clasificar imágenes, podría decirse que el estado actual de la técnica son las redes neuronales convolucionales (CNN), como lo sugiere @Martin Krämer de manera similar.
Si quiere probarlo, le sugiero que pruebe los paquetes de código abierto desarrollados por el grupo de visión Berkeley en Caffe | Marco de aprendizaje profundo. Proporcionó buenos tutoriales (tanto para instalación, compilación y uso) como demostraciones que le permiten jugar con AlexNet / GoogLeNet pre-entrenados, los cuales son CNN famosos para los desafíos de ImageNet que implican clasificar 1000 categorías de imágenes. .
¡Puede aplicar directamente su red capacitada a su problema simplemente ajustándolos en sus propios datos! Creo que lo disfrutarás una vez que lo ejecutes. De hecho, también me interesa saber por qué quieres clasificar las imágenes. Si es solo uno de los proyectos de su curso, creo que Caffe es una buena opción, ya que es fácil decirlo y terminará dándole un buen clasificador (cercano al estado de la técnica) después de un ajuste fino . Pero si desea crear un producto, tal vez sea solo un punto de partida y necesite investigar más trucos y métodos para mejorarlo.
Por supuesto, ahora hay muchos trucos propuestos para mejorar aún más la red. Si está interesado, puede seguir leyendo algunos de estos documentos:
Ampliar el reconocimiento de imagen
Acelerar el entrenamiento de redes profundas al reducir el cambio interno de covariables
Superando el rendimiento a nivel humano en la clasificación de ImageNet
Estos tres documentos son publicados por Baidu, Google y MSRA, respectivamente, y son algunos de los últimos avances de CNN.
Finalmente, quiero recordarle que si desea ajustar bien la red, debe tener una gran cantidad de datos , de lo contrario, la CNN podría no funcionar tan bien como podría esperar. En este caso, le sugiero que use algunas de las salidas intermedias de la red como representaciones de características (demostraron ser muy expresivas) de sus imágenes y aplique el clasificador tradicional, como SVM, ya que entrenar la red con datos insuficientes es propenso a sobrepasarse. -adecuado.