Una simple regresión de Softmax puede resolver su problema. No creo que la extracción de características sea necesaria para un problema como ese, pero esa es solo una opinión personal. (Si está interesado en la extracción de características, consulte el Análisis de componentes principales)
El ejemplo de principiantes para clasificar números escritos a mano en TensorFlow se puede convertir fácilmente para texto escrito a mano – MNIST para principiantes de ML
Daré una explicación básica de lo que está sucediendo en el tutorial vinculado. La intuición es que tiene 10 (porque está tratando de determinar si el número es 0, 1, 2, … o 9) clases de matriz que contienen ponderaciones entrenadas de tamaño similar a la imagen . Las 10 clases de ponderación se multiplican por el valor de píxel de la nueva imagen de entrada, brindándole su resultado, que es responsable de decirle la probabilidad de que pertenezca a su clase respectiva. P.ej
- ¿Dónde puedo obtener un conjunto de datos de notas de suicidio para fines de aprendizaje automático?
- ¿Cuáles son los conjuntos de datos canónicos de aprendizaje automático utilizados como punto de referencia para demostrar un nuevo método?
- ¿Cuáles son las ideas principales detrás de los principales algoritmos de clasificación de búsqueda?
- ¿Qué es mejor para el aprendizaje profundo: TensorFlow o Chainer?
- ¿Cuál es la mejor manera de hacer reconocimiento / clasificación de múltiples objetos en tiempo real usando OpenCV y GPU (CUDA)?
Ponderación de clase 0 x nueva entrada = probabilidad nueva imagen es 0 Ponderación de clase 1 x nueva entrada = probabilidad nueva imagen es 1 Ponderación de clase 2 x nueva entrada = probabilidad nueva imagen es 2 ... Ponderación de clase 9 x nueva entrada = probabilidad nueva imagen es 9
La clase con la probabilidad más alta sería (muy probablemente) el número representado en la nueva imagen entonces.