Si este es su primer proyecto en CV / ML, le recomendaría encarecidamente que encuentre un documento que le guste e implemente el algoritmo descrito para intentar reproducir los resultados (en lugar de intentar inventar algo nuevo). De esta manera, tendrá un objetivo claro en términos de rendimiento: si intenta inventar algo nuevo y obtiene malos resultados, será difícil saber si su algoritmo es malo o si tiene un error en algún lugar de su código (por desgracia Es por eso que la investigación es tan difícil). También lo obligará a comprender realmente el papel y el algoritmo, y a menudo lo que sucede es que se dará cuenta de una forma de mejorarlo, lo que podría conducir a una investigación original. Por cierto, ¡no pienses que es trivial implementar un algoritmo conocido! Es más fácil que inventar algo nuevo, pero te sorprendería la frecuencia con la que los detalles críticos de implementación quedan fuera de los documentos y tienes que resolver las cosas entre líneas.
En cuanto a un ejemplo específico, uno de mis papeles favoritos personales es el papel de detección de rostros Viola Jones (ver Marco de detección de objetos Viola-Jones). Lejos de ser trivial para implementar desde cero, pero factible, como resultado obtendrá un detector facial en tiempo real, ¡siempre es divertido jugar con él!
- ¿Para qué se utiliza el aprendizaje automático?
- ¿Qué significa realmente el aprendizaje automático en términos reales?
- ¿Cuáles son buenos recursos para aprender sobre la ejecución distribuida en redes neuronales profundas (MPI, allreduce, etc.)?
- ¿Cuál es la ventaja de combinar la red neuronal convolucional (CNN) y la red neuronal recurrente (RNN)?
- ¿Se pueden utilizar algoritmos genéticos y optimización de enjambre de partículas para construir sistemas de reconocimiento de voz?