¿Puedo entrenar una red neuronal convolucional (CNN) con imágenes de fondo diferente en blanco y negro?

Puede y el reconocimiento de caracteres en casos como este no es muy difícil, por lo que debería funcionar bien.

También puede hacer un preprocesamiento para facilitar aún más el problema, lo que le permite utilizar una red más pequeña.

Si sabe que las imágenes siempre son de color 1 con una letra de color 2 en el interior o de color 1 con una caja de color 2 con una letra de color 1 en el interior, puede simplificar fácilmente el problema analíticamente sin que la CNN lo aprenda.

Simplemente busque esos bordes extrañamente rectos que forman una caja. Si encuentra una caja, recorte en esa caja o invierta el color de todo dentro de la caja. Luego, si el color exterior es negro, invierta todo.

Ahora tendrá una letra negra sobre un fondo blanco cada vez.

Nuevamente, esto supone que tiene el mismo patrón en todas sus imágenes, lo que puede o no ser el caso.

Creo que sí. Se trata solo del patrón, no debería ser muy difícil para la CNN darse cuenta de lo que necesita enfocarse.

De hecho, he hecho una CNN para aprender de un fondo mucho más confuso con algunos trucos. Puedes echar un vistazo a mi trabajo aquí (Select-Additive Learning), pero diré que probablemente no necesites estos trucos elegantes.

Por cierto, ¿dónde encontraste este conjunto de datos?

Creo que debería “funcionar” tal como es porque las funciones de nivel superior se encargarán de ello.

Si tuviera más tonos, probablemente querría usar algún tipo de “blanqueamiento” (PCA o ZCA).

More Interesting

¿Cuál es la maldición de la dimensionalidad?

¿Cuáles son algunos algoritmos de corrección ortográfica que usan los motores de búsqueda? Por ejemplo, cuando utilicé Google para buscar "imágenes de Google", me preguntó: "¿Quiso decir: imágenes de Google?".

¿Dónde puedo encontrar cursos de aprendizaje automático y redes neuronales en la web?

En la optimización matemática, ¿por qué alguien usaría el descenso de gradiente para una función convexa? ¿Por qué no encontrarían simplemente la derivada de esta función y buscarían el mínimo de la manera tradicional?

¿Cómo comenzarías en Computación ubicua y programación para ello?

Cómo realizar el aprendizaje de refuerzo en una red neuronal de alimentación oculta de capas múltiples

¿Cuáles son las aplicaciones del tensor en estadística y aprendizaje automático?

¿Tengo que escuchar el curso de aprendizaje automático Coursera de Andrew Ng?

¿Puedo crear un programa de aprendizaje automático en otro idioma que no sea un flujo de tensor o scikit-learn?

¿De dónde obtengo un sentimiento de Twitter durante todo el día del conjunto de datos?

¿Qué son los datos no paramétricos?

¿Cómo soluciona un máximo A posterior el problema de sobreajuste en una estimación de máxima verosimilitud?

¿Existe una versión de objetivos múltiples de regresión logística, regresión lineal, SVM, PCA, K-means o algún otro algoritmo de aprendizaje automático?

¿Pueden las redes neuronales profundas resolver problemas NP-Hard?

¿Cuáles fueron los algoritmos utilizados para los chatbots antes de que surgiera el aprendizaje profundo?