Espero que encuentren útiles los recursos de esta competencia de Kaggle sobre la eliminación del ruido de las páginas del libro para el posterior escaneo de OCR. El foro de la competencia mencionó las dos herramientas empleadas para lograr una alta calidad para una base de datos de imágenes y canales exactos de ganadores de la competencia con código de programación incluido.
Los competidores encontraron útiles varios enfoques:
- codificadores automáticos totalmente conectados (individuales y apilados)
- red basada en parches para segmentación
- métodos simples para la separación de fondo / primer plano.
Sin embargo, en el momento de la competencia, el aprendizaje por refuerzo y las redes neuronales recurrentes no eran bien conocidas y, creo, no han sido probadas por los participantes de la competencia. Las redes totalmente convolucionales para la segmentación también están a favor ahora en comparación con los enfoques de red basados en parches.
- ¿Qué significa ser modelo pre-entrenado en CNN? ¿Ya están entrenados en esas clases particulares?
- ¿Cómo debo prepararme para Shogun Machine Learning Toolbox en GSoC? ¿Es difícil ser seleccionado en Shogun?
- ¿Cuáles son los problemas con el enfoque de clasificación uno contra todos?
- ¿Cuál es el significado físico de usar SVD / NMF en una matriz de correlación espacial?
- ¿Un doctorado en aprendizaje automático centrado en un tema que no sea el aprendizaje profundo seguirá siendo comercializable (en la industria) en 2020?