Cómo clasificar imágenes de texto en inglés y en otros idiomas usando SVM

Suponiendo que tiene las imágenes de texto impreso y no escrito a mano. Te sugiero que veas cómo lo hace tesseract. Tesseract es un motor de OCR de código abierto de Google que admite varios idiomas. Puede especificar los idiomas como opción en la línea de comandos y no solo detecta el carácter que pertenece a ese idioma, sino que también lo clasifica con una precisión muy alta.

EDITAR: entiendo que la respuesta anterior no responde la consulta directamente. En pensamientos alternativos, dado que los caracteres son exactamente del mismo tamaño, la coincidencia de patrones es una solución bastante factible para esto, es decir, verificar iterativamente los caracteres (26 mayúsculas + 26 pequeños). Entrenar el svm para estas 52 clases y evaluar cada imagen mediante ese archivo de entrenamiento conducirá a casi exactamente el mismo resultado que el de la coincidencia de patrones.
Personalmente sugiero ir con la coincidencia de patrones.

¿Qué algunos documentos sobre desafíos en predicción financiera con técnicas de aprendizaje automático?

¿Cuáles serán las características de la próxima generación de servicios de monitoreo social?

¿Qué tecnologías de IA están disponibles para el reconocimiento del usuario por comportamiento (interacción con el sistema), estilo de escritura, etc. y cómo procedo a hacer una?

¿Qué es el aprendizaje por refuerzo?

Como estudiante de pregrado de CS interesado en el aprendizaje automático, ¿cómo puedo saber si me gustaría la economía / computación financiera?

¿Cómo podemos eliminar la necesidad de un ventilador de refrigeración dentro de una computadora?

Puede crear un vector de características a partir de cada imagen, utilizando los píxeles en bruto o algún método de extracción de características adecuado (por ejemplo, PCA para características de baja dimensión) y luego combinarlos para crear una matriz de características. Además, cree un vector de etiqueta que tenga el mismo número de entradas que el número de filas del vector de características (número de imágenes). Asigne una etiqueta a cada alfabeto, por lo que en caso de que sea inglés, el vector de la etiqueta tiene valores 1-26. Luego, dele estos datos al SVM para obtener un modelo SVM entrenado, que luego puede usar en línea. En caso de que use LIBSVM (@http: //www.csie.ntu.edu.tw/~cjli…) use las funciones svmtrain y svmpredict. Está bien documentado

Vineet Chirania

More Interesting

¿Cuál es la diferencia entre el análisis de opinión y el análisis de tonalidad?

¿Cuál es la diferencia entre una curva ROC y una curva de recuperación de precisión? ¿Cuándo debo usar cada uno?

Cómo comenzar una investigación independiente en aprendizaje profundo

¿Qué son los hiperparámetros en el aprendizaje automático?

¿Aprendizaje automático sin historia matemática?

¿Las redes de confrontación generativas funcionan para la detección de valores atípicos?

¿Cuál es mejor, el modelo de regresión o ecuación estructural, y por qué?

¿Hay alguna universidad en la India que ofrezca cursos a corto plazo sobre aprendizaje automático / ciencia de datos?

Cómo llegar a un problema de aprendizaje automático para un proyecto personal

Árboles de decisión: ¿Cómo podar un CARRITO?