¡No es una pregunta simple!
Tuve el mismo problema el año pasado y me resultó muy difícil obtener un buen recurso. Probablemente ya haya realizado muchos tutoriales en línea como lo hice yo, y la mayoría de ellos no son lo suficientemente informativos ni detallados para aclarar todo.
Larga historia corta, aquí está mi principal recomendación:
- ¿Cuál es una explicación intuitiva del método de optimización llamado Hessian-free Optimizer (HF) para redes neuronales?
- ¿Cuál es un buen proyecto de aprendizaje automático para aprender Python?
- ¿Los métodos de aprendizaje automático son generales en comparación con los métodos de series temporales que se pueden llamar especializados?
- ¿Cómo ha sido su experiencia en Quora con Computer Vision y la comunidad relacionada?
- ¿Cuáles son las principales innovaciones y hallazgos del documento 'Diseño químico automático utilizando una representación continua de moléculas basada en datos'?
El libro “Aprendizaje estructurado y predicción en visión artificial”
por Sebastian Nowozin
Es corto, ordenado, autónomo, riguroso y tiene una notación muy clara.
Como respaldo, Daphne Koller tiene un curso sobre Coursera:
https://www.coursera.org/course/pgm
Este curso sigue un libro de texto escrito por Daphne Koller. Se ̶ (el curso ̶ + ̶ el libro) ̶ es más extenso que ̶N̶o̶w̶o̶z̶i̶n̶’̶s̶ libro, ̶ Sin embargo, ̶ i encontrado su notaciones etc. algo ̶c̶o̶n̶f̶u̶s̶i̶n̶g̶.̶ podría estar equivocado ̶-̶ Después de todo lo Dejase’t ir ̶T̶h̶r̶o̶u̶g̶h̶ ̶a̶l̶l̶ ̶o̶f̶ ̶i̶t̶.̶ ̶
Actualización: este curso está muy bien enseñado, sin embargo, se mueve muy rápido, por lo que me perdí cuando lo veo por primera vez. Ahora que tengo algunos antecedentes y volví a mirar de nuevo, ¡resulta ser invaluable!
Si obtuvo lo que necesita de los libros, puede comenzar a probar algunos paquetes de software:
1. Para estructuras gráficas generales, hay UGM
en Matlab y Pystruct
en Python.
2. Para datos secuenciales (es decir, 1D, como la voz), existe CRF++
. Si está trabajando en problemas relacionados con la visión, no es lo que está buscando.
3. También hay densecrf
(enlace aquí: Inferencia eficiente en densecrf
totalmente conectados con potenciales de borde gaussiano – Philipp Krähenbühl), que optimiza los CRF densos (totalmente conectados). Creo que solo funciona en cuadrículas 2D (por ejemplo, imágenes), pero está completamente optimizado para inferencia extra rápida, por lo tanto, es una gran opción para problemas de visión.
Los modelos gráficos tienen un formato de E / S bastante complicado, ciertamente no querrá escribir su propio código de entrenamiento CRF desde el principio.