Redes neuronales convolucionales: ¿Cuáles son algunos posibles proyectos de cursos de aprendizaje automático de nivel de posgrado que utilizan CNN? Específicamente en el límite de PNL y CV.

Definición de siglas

  • PNL: Procesamiento de lenguaje natural
  • CNN: redes neuronales convolucionales
  • CV: Visión por computadora
  • DBN: Redes de creencias profundas

CNN

Un punto de partida natural es el reconocimiento óptico de caracteres (OCR). Para ver un ejemplo, consulte el sitio web de Kaggle:

Reconocimiento de dígitos

El algoritmo CNN convierte los caracteres ópticos en dígitos. Actualmente, CNN se desempeña muy bien y casi el mejor en el reconocimiento de dígitos. Sin embargo, DBN puede disfrutar del mejor rendimiento.

¿Cómo vencer a DBN? En ciertas circunstancias, puede conectar CNN en cascada con PNL.

CNN + PNL

Si utiliza OCR para un texto en inglés, podría hacerlo mejor combinando NLP con su herramienta de OCR. Por ejemplo,

Reina
REINA

Si OCR no está seguro de decodificar el último carácter óptico en un texto en inglés que sea `M` o` N`, puede estar razonablemente seguro de que la letra es una `N` porque esto deletrea una palabra. Esto es autocorrección . Es como autocorrección para SMS o mensajes de texto. Pero, esta autocorrección sería diferente sin interactividad.

Tenga en cuenta que la autocorrección puede necesitar sofisticación adicional.

A.M
UN

¿Es la última letra `M` o` N`? Es posible que necesite hacer referencia a palabras adyacentes.

En total, la combinación de CNN y NLP podría mejorar una herramienta de OCR. Esto puede proporcionar una mejora en el rendimiento sobre CNN independiente, en promedio.

SUGERENCIA

Para un proyecto de escuela de posgrado, una implementación óptima utilizando Bayes Theory (a nivel de documento / libro) sería inviable. Dispararía por mejorar el OCR usando CNN + NLP para un texto pequeño (posiblemente a nivel de palabra / oración / párrafo).

No soy un experto en PNL pero hay muchos trabajos realizados en la era de CV. Si sus recursos de computación son limitados, le sugiero que use conjuntos de datos de imágenes pequeñas como CIFAR o use conjuntos normales en tamaños pequeños, ya que los algoritmos CNN y Deep Learning no son lo suficientemente escalables para ejecutarse en máquinas simples.

Si fuera usted, descargaría CIFAR y elegiría el aprendizaje de funciones simples con CNN y la clasificación con redes Deep Neural como RBM o codificadores automáticos con un pequeño proceso de ajuste previo.

Esos pasos parecen simples, pero cuando entras en el trabajo verás que no es tan fácil. Hay muchos detalles dolorosos como el número de unidades de ajuste, la estructura neta, los números de filtro y demás.