Redes neuronales convolucionales: ¿Cuáles son algunos posibles proyectos de cursos de aprendizaje automático de nivel de posgrado que utilizan CNN? Específicamente en el límite de PNL y CV.

Definición de siglas

PNL: Procesamiento de lenguaje natural
CNN: redes neuronales convolucionales
CV: Visión por computadora
DBN: Redes de creencias profundas

CNN

Un punto de partida natural es el reconocimiento óptico de caracteres (OCR). Para ver un ejemplo, consulte el sitio web de Kaggle:

Reconocimiento de dígitos

El algoritmo CNN convierte los caracteres ópticos en dígitos. Actualmente, CNN se desempeña muy bien y casi el mejor en el reconocimiento de dígitos. Sin embargo, DBN puede disfrutar del mejor rendimiento.

¿Cómo vencer a DBN? En ciertas circunstancias, puede conectar CNN en cascada con PNL.

CNN + PNL

Si utiliza OCR para un texto en inglés, podría hacerlo mejor combinando NLP con su herramienta de OCR. Por ejemplo,

Reina
REINA

Si OCR no está seguro de decodificar el último carácter óptico en un texto en inglés que sea `M` o` N`, puede estar razonablemente seguro de que la letra es una `N` porque esto deletrea una palabra. Esto es autocorrección . Es como autocorrección para SMS o mensajes de texto. Pero, esta autocorrección sería diferente sin interactividad.

Tenga en cuenta que la autocorrección puede necesitar sofisticación adicional.

A.M
UN

¿Es la última letra `M` o` N`? Es posible que necesite hacer referencia a palabras adyacentes.

En total, la combinación de CNN y NLP podría mejorar una herramienta de OCR. Esto puede proporcionar una mejora en el rendimiento sobre CNN independiente, en promedio.

SUGERENCIA

Para un proyecto de escuela de posgrado, una implementación óptima utilizando Bayes Theory (a nivel de documento / libro) sería inviable. Dispararía por mejorar el OCR usando CNN + NLP para un texto pequeño (posiblemente a nivel de palabra / oración / párrafo).

Related Content

¿El aprendizaje automático es un tema torpe?

¿Cómo reconoce la red neuronal convolucional los objetos de las imágenes sin la percepción o reconocimiento 3D?

Cómo implementar el descenso de gradiente de mini lotes en una red neuronal

¿Cuál es una buena manera de entender la pérdida de Minkowski con una configuración diferente?

Cómo saber si mi modelo de regresión es heteroscedastic u homoscedastic de mi modelo de residuos

¿Cuántas puertas lógicas se necesitan para multiplicar dos enteros de n bits?

¿Hay bases de datos de palabras clave abiertas?

No soy un experto en PNL pero hay muchos trabajos realizados en la era de CV. Si sus recursos de computación son limitados, le sugiero que use conjuntos de datos de imágenes pequeñas como CIFAR o use conjuntos normales en tamaños pequeños, ya que los algoritmos CNN y Deep Learning no son lo suficientemente escalables para ejecutarse en máquinas simples.

Si fuera usted, descargaría CIFAR y elegiría el aprendizaje de funciones simples con CNN y la clasificación con redes Deep Neural como RBM o codificadores automáticos con un pequeño proceso de ajuste previo.

Esos pasos parecen simples, pero cuando entras en el trabajo verás que no es tan fácil. Hay muchos detalles dolorosos como el número de unidades de ajuste, la estructura neta, los números de filtro y demás.

Eren Golge

More Interesting

¿Cuáles son los problemas médicos que el aprendizaje automático puede resolver?

¿Cuáles son algunos buenos ejemplos donde el agrupamiento se usa como método para la extracción de características?

¿Cómo funciona la propagación hacia atrás en la red neuronal convolucional?

¿Por qué decimos que las redes neuronales simples no pueden manejar la entrada de longitud variable?

¿Debo escribir el código de Random Forest por mi cuenta o usar implementaciones existentes?

Cómo optimizar la clasificación de varias clases si ya conozco el número de ocurrencias de cada clase en el conjunto de datos de prueba

Cómo implementar Inteligencia Artificial en un Proyecto Arduino

¿Cómo funciona el refuerzo con los algoritmos de clasificación del árbol de decisión?

¿Cuáles son los principales niveles de clasificación de reclusos?

¿Qué método de aprendizaje profundo usar para clasificar archivos de texto?

Cómo interpretar el resultado de una red totalmente convolucional

¿Son los modelos de n-gramas, la codificación de uno en caliente y word2vec diferentes tipos de representaciones de palabras y vectores de palabras?

¿Cuál es el estado del arte en reconocimiento de voz en 2016?

¿Dónde empiezo a aprender Machine Learning?

¿Hay algún kit de herramientas LSTM disponible en MATLAB?

Web Analytics