Definición de siglas
- PNL: Procesamiento de lenguaje natural
- CNN: redes neuronales convolucionales
- CV: Visión por computadora
- DBN: Redes de creencias profundas
CNN
Un punto de partida natural es el reconocimiento óptico de caracteres (OCR). Para ver un ejemplo, consulte el sitio web de Kaggle:
Reconocimiento de dígitos
El algoritmo CNN convierte los caracteres ópticos en dígitos. Actualmente, CNN se desempeña muy bien y casi el mejor en el reconocimiento de dígitos. Sin embargo, DBN puede disfrutar del mejor rendimiento.
- ¿Puedo usar el aprendizaje profundo para aprender el aprendizaje profundo?
- ¿Cómo puedo demostrar que si no escalo las características antes de aplicar el descenso de gradiente, disminuirá la convergencia?
- ¿Cuál es el mejor método para presentar la idea de una red neuronal de convolución a un profano?
- ¿Cómo escribe Google las pruebas para su algoritmo de búsqueda para que sepan que no lo rompieron al hacer cambios?
- ¿Cuáles son las mejores prácticas en torno al aprendizaje automático y los sistemas de recomendación para sitios de trabajo?
¿Cómo vencer a DBN? En ciertas circunstancias, puede conectar CNN en cascada con PNL.
CNN + PNL
Si utiliza OCR para un texto en inglés, podría hacerlo mejor combinando NLP con su herramienta de OCR. Por ejemplo,
Reina
REINA
Si OCR no está seguro de decodificar el último carácter óptico en un texto en inglés que sea `M` o` N`, puede estar razonablemente seguro de que la letra es una `N` porque esto deletrea una palabra. Esto es autocorrección . Es como autocorrección para SMS o mensajes de texto. Pero, esta autocorrección sería diferente sin interactividad.
Tenga en cuenta que la autocorrección puede necesitar sofisticación adicional.
A.M
UN
¿Es la última letra `M` o` N`? Es posible que necesite hacer referencia a palabras adyacentes.
En total, la combinación de CNN y NLP podría mejorar una herramienta de OCR. Esto puede proporcionar una mejora en el rendimiento sobre CNN independiente, en promedio.
SUGERENCIA
Para un proyecto de escuela de posgrado, una implementación óptima utilizando Bayes Theory (a nivel de documento / libro) sería inviable. Dispararía por mejorar el OCR usando CNN + NLP para un texto pequeño (posiblemente a nivel de palabra / oración / párrafo).