¿Qué compañías están desarrollando el mejor software de OCR?

Aquí hay una lista de los mejores programas de OCR:

Software ABBYY FineReader OCR para reconocimiento de texto y conversión de documentos con funciones OCR PDF

OmniPage – Software de conversión de documentos

tesseract-ocr: un motor de OCR que se desarrolló en HP Labs entre 1985 y 1995 … y ahora en Google. – Alojamiento de proyectos de Google

He probado personalmente todo el software anterior y descubrí que ABBYY fine reader es bastante bueno, incluso con baja resolución e imágenes distorsionadas (perspectiva), el reconocimiento es bueno …

Pero, todo el software anterior todavía se limita al texto en documentos (en su mayoría impresos) y el reconocimiento de texto en comodín (texto de escena) sigue siendo un problema de investigación abierto. Se está trabajando mucho en Google (Goggles) y otras compañías que necesitan OCR de texto capturado usando un teléfono inteligente …

Hay muchas compañías que están desarrollando el software OCR que escanea el documento y luego lo almacena en el formato requerido. La ventaja es que incluso puede editar el texto en una imagen.

Aquí está la lista de las principales empresas de fabricación de software OCR.

  1. OCR, ICR, OMR – Reconocimiento óptico de caracteres y soluciones lingüísticas – ABBYY
  2. Captura de documentos, OCR, escaneo, hipoteca, factura, código abierto.
  3. Gestión de documentos

Estas compañías ofrecen varios beneficios al utilizar el software OCR, ya que son líderes en la industria y siguen actualizando el software con las últimas tecnologías y complementos para que pueda obtener lo mejor.

Las mejores soluciones de OCR en el mercado son Google Tesseract, ABBYY y Anyline.

Tesseract es más una herramienta de desarrollo. Puede hacer algo de procesamiento de imágenes internamente utilizando la biblioteca Leptonica, pero los resultados generalmente no son muy precisos. Además, para obtener los mejores resultados, las imágenes deben estar por debajo de 300 DPI, lo que dificulta el procesamiento previo de las imágenes de alta resolución. Tesseract puede darle los mejores resultados cuando se proporciona, “texto negro cristalino sobre un fondo blanco puro”. ABBYY también es un gran jugador en el mundo de OCR y básicamente se especializa en escaneo de documentos.

Anyline es una solución lista para usar, especializada en OCR móvil: ofrecen un SDK de OCR móvil gratuito con una variedad de casos de uso. Estas páginas explican la diferencia.

Abbyy versus Anyline – ANYLINE

Tesseract vs Anyline | Alternativas de Tesseract

En mi opinión, es Iris OCR.

IRIS, establecida en 1986, es un líder mundial dedicado en tecnologías de OCR y escaneo móvil. Con el objetivo de obtener todo tipo de documentos en papel en archivos de computadora editables para todos, IRIS nos ha traído muchas soluciones poderosas y kits de OCR para hacer Iris OCR. Su serie Readiris está abierta tanto para usuarios de Mac como de Windows, permitiendo a los usuarios conectarse directamente al escáner e importar copias digitales de archivos en papel, convertir archivos escaneados a formatos editables bien formateados.

Google tiene un producto llamado Google Goggles en el móvil que puede reconocer caracteres. Incluso se puede resolver un Sudoku con esta aplicación.

Esperemos que algún día podamos esperar que Google vincule el proyecto Google Goggles con el proyecto Google Glass. Entonces uno puede usar anteojos que pueden ver el texto.
Leer libros sería muy fácil entonces.

http://www.google.com/mobile/gog
http://en.wikipedia.org/wiki/Pro
https://plus.google.com/11162612

Cuando alguien me pregunta “¿Qué compañías están desarrollando el mejor software de OCR?” Yo recomendaría Cisdem.

Aquí le contaré uno de los mejores software de OCR de Cisdem y cómo crear documentos PDF e imágenes.

Cisdem PDF Converter OCR para Mac viene a ayudarlo a convertir cualquier PDF nativo, PDF escaneado y PDF encriptado a PDF editable y con capacidad de búsqueda, Word, Texto, Excel, PPT, ePub, HTML, Texto, Rtfd, Páginas, Keynote y documentos de imagen ( JPEG, BMP, PNG, GIF, TIFF) con su tecnología OCR manteniendo el diseño original y la calidad del archivo.

¿Cómo OCR?

1. Descargar Cisdem PDF Converter OCR

Descarga aquí

2. Suelta los archivos en la interfaz

3. Elija el formato de salida.

Puede configurar el formato de salida como PDF, RTFD, DOCX, DOC, XLSX o PPTX, cualquier formato compatible que desee guardar como.

4. Comience a convertir.

Si tiene algún problema sobre cómo OCR de archivos PDF, puede preguntarme o visitar Cisdem.com. Por cierto, este video también puede ayudarte.

La mayoría de los motores OCR de hoy hacen un buen trabajo al convertir imágenes a texto, pero no alcanzan:

Último 20-15% de extracción

Exactitud dentro de un contexto

Alinearse con las necesidades del negocio.

Te dan un buen comienzo pero no te dan un gran final.

¿Cómo podemos obtener un 99% de precisión de estos motores OCR? ¿Cómo hago más con mis datos? ¿Hay alguna manera de organizar mejor los datos de salida de mi motor OCR? ¿Cómo reduzco mi esfuerzo y hago mi trabajo? La respuesta a todo esto y mucho más es Machine Learning.

En Infrrd.ai: Enterprise Machine Intelligence utilizamos el Poder del aprendizaje automático con la sofisticación de OCR para proporcionar servicio en diversas áreas, como gestión financiera, documentación comercial, factura, etc. Tenemos compañías de tarjetas de combustible que utilizan nuestra plataforma para capturar automáticamente las fotos de los recibos. , extraer el precio y el IVA de las compras a través de la solución de OCR basada en dispositivos móviles, las empresas de gestión de gastos utilizan nuestra plataforma para capturar, extraer y clasificar recibos de gastos de dispositivos móviles y las empresas de financiación de cuentas por cobrar utilizan nuestra plataforma para extraer automáticamente información de las facturas de sus clientes. Por lo tanto, con el aprendizaje automático se pueden resolver las diversas deficiencias de OCR.

Yunmai Technology Company es un desarrollador profesional del SDK de reconocimiento óptico de caracteres y se ha convertido en uno de los mejores desarrolladores de tecnología de OCR móvil en la industria. Puede proporcionar OCR SDK para documentos, tarjetas de visita, tarjetas bancarias, así como reconocimiento de tarjetas de identificación. El proveedor de la aplicación Mobile OCR y OCR SDK ha desarrollado Business Card Reader y Docs Matter – Mobile Scanner – Yunmai Technology, que se utiliza principalmente para leer documentos y recuperar textos dentro de ellos.

El software de OCR puede leer cada texto impreso, ya sean palabras o números. Addmen es una de las mejores compañías de soluciones de software de OCR, que desarrolla el mejor software de OCR.

tal vez alguien diga abbyy, pero quiero recomendar a Google tesseract OCR. Fue construido durante 20 años, puede reconocer más de 100 tipos de idiomas, contiene los idiomas más utilizados.
y la versión tesseract 3.04 agrega la función de guardar el texto extraído en un documento PDF con capacidad de búsqueda. Es realmente maravilloso.
puede probar este OCR en línea gratuito para usar la nueva característica de tesseract OCR.

Póngase en contacto con KritiKal Solutions en India, desarrollan soluciones OCR personalizadas. Estos chicos pertenecen a IIT Delhi y trabajan solo con el Gobierno y la Defensa. Creo que ahora están trabajando en muchos proyectos pero no promueven sus servicios.

Póngase en contacto con este tipo que puede ayudar, él es mi antiguo contacto para el sistema ADAS:

Añil
[correo electrónico protegido]

Si no desea instalar el software OCR en su computadora, puede probar alguna herramienta gratuita en línea de OCR, solo busque en Google. Si es un programador, puede probar el componente xspdf para extraer texto de la imagen en C #, está utilizando el motor tesseract ocr y proporciona un resultado más preciso.

Ver Mitek Systems en San Diego. La imagen de depósito de cheques de teléfonos inteligentes utilizada por Chase es de Mitek.