¿Existen API o startups que se especialicen en OCR a partir de imágenes tomadas por cámaras de teléfonos inteligentes?

Proporcionamos API y kit de herramientas móvil para capturar imágenes de recibos y extraer detalles de la plataforma móvil. Puedes verlo en acción aqui:

Video de demostración de OCR móvil

Después de haber trabajado con muchas soluciones de OCR, nos hemos dado cuenta de que ninguna de las tecnologías de OCR actuales por sí solas puede proporcionar una solución comercial sólida.

Lo que mejor funcionó para nuestros clientes es la combinación de tecnologías de aprendizaje automático y múltiples motores de OCR. Los diferentes motores de OCR tienen diferentes puntos fuertes: algunos funcionan muy bien en documentos escaneados, otros son buenos en imágenes capturadas desde dispositivos móviles.

Pero una vez que implementa la ciencia de datos y las tecnologías de aprendizaje automático sobre los datos extraídos, obtiene algo que es mucho más potente que el OCR de vainilla. Lo hemos utilizado para capturar datos personales de licencias de conducir y pasaportes:

Solución y plataforma de detección de fraude de identidad

Extracción de detalles de facturas, gastos:

Sistema móvil de escaneo de recibos y extracción de datos

y varios otros casos de uso. Espero que esto ayude.

Dado que usted estará principalmente interesado en un dominio e idioma en particular, obtendrá mejores resultados si entrena al clasificador.
Como tal, mi recomendación sería ir con una biblioteca de código abierto que pueda usar para crear una solución personalizada. Prueba tesseract-ocr .

Si prefiere la API, pruebe ocr.space o abbyy. Aunque no los he probado yo mismo. ¡Entonces, no sabría sobre los resultados!

Espero que ayude. ¡Aclamaciones!

Hola saul

¿Está interesado en las aplicaciones que desea usar o desea crear una aplicación que pueda aprovechar la API?

Suman