Cómo aprender a crear un sistema óptico de reconocimiento de caracteres utilizando redes neuronales artificiales como mi mini proyecto

Para facilitar su tarea, deberá asegurarse de que su conjunto de datos consista en imágenes que tengan el mismo tamaño de fuente. Esto es necesario para arreglar el tamaño de la ventana. Si el conjunto de datos consta de texto con un tamaño diferente, deberá usar una ventana de tamaño variable.

Después de elegir la ventana, debe deslizar la ventana horizontal y verticalmente para obtener todos los caracteres de la imagen.

La ventana puede contener uno de los siguientes:

Un personaje
La mitad de un personaje y la mitad del siguiente personaje de la imagen.
Un espacio en blanco

Ahora debe pasar los píxeles de dichas ventanas junto con las etiquetas correspondientes al algoritmo para entrenar. Una vez entrenado, debe repetir el mismo procedimiento.

Si la ventana contiene espacio en blanco, puede comenzar una nueva palabra

Si la ventana contiene la mitad de un carácter y la mitad del siguiente carácter, podría inferir que ambos caracteres son parte de la misma palabra.

Si la ventana contiene un carácter, agréguelo a la palabra actual.

Aprendizaje automáticoInteligencia ArtificialReconocimiento óptico de caracteresRedes neuronales artificiales

Related Content

¿Dónde puedo encontrar corpus de texto médico en inglés para entrenar mis datos?

¿Por qué la normalización media ayuda en el descenso del gradiente?

¿Por qué algunos profesores dicen que nunca entendieron realmente las matemáticas o las estadísticas hasta que primero enseñaron un curso sobre ese tema?

¿Cuáles son algunos de los buenos libros sobre redes neuronales artificiales, minería de datos, aprendizaje automático, big data y análisis de datos?

¿Cuál es la mejor manera de personalizar los artículos para un usuario en función de su historial de lectura?

¿Cuál es la diferencia clave entre backprop y backprop truncado a través del tiempo?

¿Cuál es la diferencia entre el descenso en gradiente y el descenso coordinado?

Solución:

Conjunto de datos MNIST y redes neuronales básicas con función sigmoidea, el descenso de gradiente funcionará con una precisión de más del 97%.

Envíame un mensaje si tienes alguna duda.

Jagpreet Singh Sasan

More Interesting

¿Cuál es la diferencia entre los métodos de gradiente de políticas y los métodos de actor crítico?

¿Cuál es una buena manera de clasificar los documentos de texto contra un modelo de tema arbitrario?

¿Cómo calcula Google los sinónimos de los términos en una consulta de búsqueda?

¿Cuál es la razón para mapear datos de dos idiomas diferentes en un espacio de incrustación de palabras común y no usar dictonarios y asignarle el idioma b a los vectores del idioma a para entrenar un modelo de manera multilingüe?

¿Quién ha explorado las aplicaciones del modelo Word2vec en datos que no sean lenguajes naturales?

¿El filtrado colaborativo se considera aprendizaje automático?

¿Será el hardware especializado para el aprendizaje profundo un cambio de juego?

Cómo entrenar un modelo word2vec como GoogleNews-vectors-negative300.bin para francés

¿Por qué asumiríamos que los datos son iid cuando no lo son?

¿Cuál es la función de transferencia en redes neuronales artificiales?

¿Cuál es una explicación intuitiva para el problema de optimización cuadrática?

El lenguaje de máquina se ha mencionado en todas partes. ¿Qué es en realidad?

Cómo entrenar un clasificador SVM a partir de ejemplos de texto

¿Cuáles son las diferencias entre GRU y RNN estándar?

¿Cuál es el mejor foro de red neuronal en Internet?

Web Analytics