¿Cuál es un buen algoritmo para la extracción de características y la detección de texto escrito a mano?

Una simple regresión de Softmax puede resolver su problema. No creo que la extracción de características sea necesaria para un problema como ese, pero esa es solo una opinión personal. (Si está interesado en la extracción de características, consulte el Análisis de componentes principales)

El ejemplo de principiantes para clasificar números escritos a mano en TensorFlow se puede convertir fácilmente para texto escrito a mano – MNIST para principiantes de ML

Daré una explicación básica de lo que está sucediendo en el tutorial vinculado. La intuición es que tiene 10 (porque está tratando de determinar si el número es 0, 1, 2, … o 9) clases de matriz que contienen ponderaciones entrenadas de tamaño similar a la imagen . Las 10 clases de ponderación se multiplican por el valor de píxel de la nueva imagen de entrada, brindándole su resultado, que es responsable de decirle la probabilidad de que pertenezca a su clase respectiva. P.ej

  Ponderación de clase 0 x nueva entrada = probabilidad nueva imagen es 0
 Ponderación de clase 1 x nueva entrada = probabilidad nueva imagen es 1
 Ponderación de clase 2 x nueva entrada = probabilidad nueva imagen es 2
 ...
 Ponderación de clase 9 x nueva entrada = probabilidad nueva imagen es 9

La clase con la probabilidad más alta sería (muy probablemente) el número representado en la nueva imagen entonces.

Algoritmos deAprendizaje automáticoExtracción de característicasProcesamiento de imágenesProcesamiento de lenguaje naturalReconocimiento óptico de caracteres

Related Content

¿Se utilizan algoritmos evolutivos como PSO en el aprendizaje profundo para encontrar pesos óptimos?

¿Se puede usar un C ++ para el aprendizaje automático? Si es así, ¿qué tan bueno es en comparación con Python y R?

¿Es aconsejable crear una aplicación basada en el aprendizaje automático y el procesamiento de imágenes sin comprender el concepto matemático subyacente?

¿La validación cruzada más pequeña siempre es un indicador de un mejor modelo predictivo incluso si un modelo predictivo tiene una gran cantidad de parámetros?

¿Dónde están los temas interesantes que se cruzan con la neurociencia y el aprendizaje automático?

¿Qué significa ‘estimación ML o MAP no captura la incertidumbre de los parámetros’?

¿Cuáles son algunos proyectos increíbles bajo 100 líneas?

More Interesting

¿Qué opinas sobre el software de gestión del tiempo AI?

¿Cuáles son algunos algoritmos de corrección ortográfica que usan los motores de búsqueda? Por ejemplo, cuando utilicé Google para buscar "imágenes de Google", me preguntó: "¿Quiso decir: imágenes de Google?".

¿Por qué muchos estudios de investigación afirman que el aprendizaje profundo es una caja negra?

¿Cuáles son los trabajos más interesantes de CVPR 2016 y por qué?

Cómo detectar texto / imágenes en una imagen de documento

¿Puedo aprender el aprendizaje automático sin conocer álgebra lineal, estadísticas y probabilidad?

¿Cuántas muestras de entrenamiento se necesitan para obtener un modelo confiable en ML?

¿Existe alguna base biológica para las redes de confrontación generativas?

Durante la limpieza de datos cuando tiene un número decimal que representa el número de personas, ¿debe redondear hacia arriba o hacia abajo? Además, ¿qué sucede si el número total de todos los números redondeados no coincide con el número total de personas, es un error?

He completado el curso para el aprendizaje automático. Quiero hacer un proyecto corto sobre aprendizaje automático. Actualmente estoy haciendo BE en CS. ¿Qué materia debo elegir?

¿Cuál es la diferencia entre la agrupación de texto y la clasificación de texto?

¿Qué significa para una red neuronal ser entrenada de extremo a extremo?

¿Cuál es la pérdida latente en autoencoders variacionales?

¿Qué es el modelado de mezclas gaussianas?

¿Es razonable excluir valores atípicos en su conjunto de datos de entrenamiento para su clasificador?

Web Analytics