Cómo detectar imágenes en un documento de Word escaneado

En general, eso no será fácil, pero aquí hay algunas ideas:

1. Primero, normalizará su escaneo (es decir, encontrará bordes, hará que la perspectiva se transforme, normalice el contraste, etc.). La mejor manera de hacerlo (si no puede usar OCR comercial) es usar OpenCV. Aquí hay un ejemplo relevante: Extraer texto de una imagen usando Ocropus

2. Segundo, debes detectar el texto y segmentar tu página. Dependiendo de sus objetivos, puede reinventar la rueda patentada y escribir su propio algoritmo, o usar herramientas de código abierto como esta: tmbdev / ocropy

3. Después de tener a mano los bloques de texto, elimínelos (al menos, lógicamente). Lo que queda podría ser tus fotos, si es que existen. Y debe realizar comprobaciones de complejidad simples para saber que realmente maneja la imagen, por ejemplo, calcular el índice de Hurst (exponente de Hurst). Es un hecho bien conocido que las imágenes reales tendrán dependencias muy complejas de corto y largo alcance, y el índice Hurst le dará una pista de si realmente tiene un objeto complejo o simple.

Related Content

Cómo encontrar el elemento mínimo en un subárbol de un montón máximo

Cómo hacer un sitio web que contenga algoritmos

Cómo implementar un algoritmo C4.5 usando MATLAB

¿Es c * O (n) = O (n) verdadero?

Cómo calcular el número 50 usando números binarios

1,000 participantes toman un examen que consta de 100 preguntas y 5 opciones por pregunta. ¿Cuál es el mejor enfoque (algoritmo) para encontrar todos los pares posibles de participantes con al menos un 80% de coincidencia en las opciones que eligieron?

¿Cuál es el algoritmo detrás de la agregación de noticias de Facebook News alrededor de una palabra clave en particular?

More Interesting

¿Qué es la eficiencia del algoritmo?

Cómo recorrer un trabajo de búsqueda binaria e imprimirlo en orden

¿Se utiliza una estructura de datos de pila para algoritmos multirecursionales?

¿Qué es el recorrido del árbol y por qué los necesita?

¿Cuáles son las aplicaciones del mundo real de algunas estructuras de datos avanzadas, y cuándo elegiría una estructura de datos sobre otra, en el caso de estructuras de datos similares?

Cómo verificar el número dado es múltiplo de 3 sin usar el operador de módulo

¿Es posible codificar un programa que, dada una secuencia finita, encuentra al menos 2 reglas posibles que generan las series restantes?

¿Cómo podemos demostrar que el reconocimiento de objetos basado en la visión es un problema np completo?

¿Qué es la técnica Hashing?

¿Qué algoritmo es mejor para una variante 4 * 4 * 4 * 4 del último dedo del pie tic-tac considerando un límite de tiempo de 15 segundos?

Cómo aprender estructuras de datos y algoritmos

¿Cuáles son los algoritmos que se pueden usar en aplicaciones web del mundo real además de ordenar o buscar?

¿Es la programación una superpotencia? ¿Por qué o por qué no?

¿Cómo funciona la transformación cuántica de Fourier?

¿Por qué la complejidad del algoritmo O (logN) significa que los datos disminuyen a la mitad?

Web Analytics