¿Qué es el reconocimiento óptico de caracteres (OCR)?

El reconocimiento óptico de caracteres es una tecnología que literalmente ha revolucionado el proceso de gestión de documentos en varios sectores, a saber, jurídico, bancario, educativo, sanitario, financiero y gubernamental. Ha ayudado a transformar las oficinas en oficinas sin papel al ayudar a digitalizar documentos y comunicaciones que se han mantenido resistentes a la digitalización con rapidez y precisión. Estos incluyen documentos en papel escaneados y archivos PDF o imágenes capturadas por una cámara digital.

Además, el avance del reconocimiento óptico de caracteres de un lector de propósito especial a un sistema interactivo multipropósito ha reducido el costo de captura de datos y ha allanado el camino para el desarrollo de sistemas más confiables. Esto también tendrá un impacto positivo en el mercado.

Obtenga más información sobre la investigación de mercado de transparencia de OCR

Redes neuronales convolucionales: ¿Cuáles son algunos posibles proyectos de cursos de aprendizaje automático de nivel de posgrado que utilizan CNN? Específicamente en el límite de PNL y CV.

En LSTM, ¿cómo calculas qué tamaño deben tener los pesos?

¿Es posible o valioso obtener otro doctorado en Machine Learning (Deep Learning) de una de las 50 mejores universidades de los Estados Unidos?

¿Qué consejo le darías a los estudiantes de doctorado que comienzan su doctorado en aprendizaje automático?

¿Cuáles son las características importantes para el análisis de sentimientos basado en aspectos en el enfoque de aprendizaje automático? ¿Qué algoritmos se pueden usar para extraer estas características?

¿Por qué los Estados Unidos retiraron fondos del programa de robots SWORDS?

OCR es el reconocimiento de caracteres de texto impresos o escritos por una computadora. Esto implica el escaneo de fotos del texto carácter por carácter, el análisis de la imagen escaneada y luego la traducción de la imagen del carácter en códigos de caracteres, como ASCII, comúnmente utilizados en el procesamiento de datos.

En el procesamiento de OCR, la imagen escaneada o el mapa de bits se analiza en busca de áreas claras y oscuras para identificar cada letra alfabética o dígito numérico. Cuando se reconoce un carácter, se convierte en un código ASCII. Se utilizan placas de circuitos especiales y chips de computadora diseñados expresamente para OCR para acelerar el proceso de reconocimiento.

Las bibliotecas están utilizando OCR para digitalizar y preservar sus existencias. OCR también se utiliza para procesar cheques y recibos de tarjetas de crédito y clasificar el correo. Miles de millones de revistas y cartas se clasifican todos los días por máquinas OCR, lo que acelera considerablemente la entrega del correo.

Harshad Borde

Ese es un programa que escanea una imagen y la convierte en texto editable y con capacidad de búsqueda.

Entonces, digamos que tomas un número de 1932 de Historias asombrosas.

Escanea una página desde allí.

El escaneo ahora es un archivo de imagen, es decir, un montón de píxeles de diferentes colores.

Si tiene reconocimiento óptico de caracteres en lugar de una imagen basada en píxeles, tiene un archivo de texto totalmente editable (o documento de Microsoft Word, etc.) donde puede leer o editar el texto.

Entonces, la respuesta corta es que tiene texto real en lugar de una imagen de texto.

Thomas

El reconocimiento óptico de caracteres (OCR, por sus siglas en inglés) es una tecnología que puede escanear y extraer fácilmente el texto de las imágenes del documento, y luego convertirlas en archivos editables y con capacidad de búsqueda.

Por ejemplo, Docs Matter, es un buen escáner móvil de documentos. Es capaz de escanear mis documentos en papel y recuperar textos de ellos. Además, puedo editar los resultados del reconocimiento y guardarlos. Dondequiera que esté, puedo buscar los documentos que necesito ingresando algunas palabras clave.

May Lin

OCR se refiere a la conversión mecánica o electrónica de imágenes, de texto mecanografiado, escrito a mano o impreso en texto codificado por máquina.

o simplemente, significa hacer que el contenido sea legible en la computadora, hay 2 sistemas principales de OCR: Matrix Matching & Feature Extraction

Además, hay muchas herramientas OCR dedicadas creadas para hacer que los archivos no editables se puedan volver a escribir y leer en segundos:

Cisdem PDFConverterOCR

OCRKit Pro

ABBYYFineReader

……

May Lin

OCR es la capacidad de una máquina para extraer toda la información de una imagen en texto editable. Cuando normalmente escanea un documento con un escáner básico, no puede editar la información más adelante. Con OCR esto es posible. Imagine escanear todas sus facturas como archivos PDF y luego poder editar toda la información que desee. ¡O escanee su medidor de electricidad con su teléfono inteligente en lugar de escribir los números! Consulte este artículo para obtener más información útil: ¿Qué es OCR y por qué le facilita la vida?

Harshad Borde

OCR (reconocimiento óptico de caracteres) reconoce todos los caracteres del documento en papel, los recopila y almacena en documentos editables

May Lin

More Interesting

¿Qué enfoques / regulaciones se utilizan para manejar el 'problema mínimo / máximo local' cuando se usa el descenso de gradiente con redes neuronales profundas?

¿Cuáles son algunos proyectos geniales de aprendizaje automático que ha creado?

Cómo llegar a un problema de aprendizaje automático para un proyecto personal

¿Cuáles son los beneficios de convertir una capa totalmente conectada en una red neuronal profunda a una capa convolucional equivalente?

¿Cuál es la mejor herramienta de aprendizaje automático para Mac OS?

Cómo detectar y eliminar valores atípicos de ese conjunto de datos

¿Es el hecho de que los algoritmos de aprendizaje profundo requieren grandes extensiones de datos como una limitación final de su potencial en IA?

¿Qué está haciendo Wavii con el aprendizaje automático para redefinir cómo se realiza la búsqueda en la web?