¿Puedo entrenar una red neuronal convolucional (CNN) con imágenes de fondo diferente en blanco y negro?

Puede y el reconocimiento de caracteres en casos como este no es muy difícil, por lo que debería funcionar bien.

También puede hacer un preprocesamiento para facilitar aún más el problema, lo que le permite utilizar una red más pequeña.

Si sabe que las imágenes siempre son de color 1 con una letra de color 2 en el interior o de color 1 con una caja de color 2 con una letra de color 1 en el interior, puede simplificar fácilmente el problema analíticamente sin que la CNN lo aprenda.

Simplemente busque esos bordes extrañamente rectos que forman una caja. Si encuentra una caja, recorte en esa caja o invierta el color de todo dentro de la caja. Luego, si el color exterior es negro, invierta todo.

Ahora tendrá una letra negra sobre un fondo blanco cada vez.

Nuevamente, esto supone que tiene el mismo patrón en todas sus imágenes, lo que puede o no ser el caso.

Aprendizaje automáticoAprendizaje profundoRedes neuronales artificialesRedes neuronales convolucionalesVisión por computadora

¿Cuáles son los modelos actuales de análisis de sentimiento de arte independientemente de la efectividad?

¿Existe alguna posibilidad de que la química del aprendizaje automático pueda correlacionarse con la nanotecnología?

¿Cómo se usa LSTM para la clasificación?

¿Cómo debo elegir entre SVM y árbol de decisión para un problema de clasificación?

¿Cómo puede ser útil la geometría fractal para la inteligencia artificial y / o el aprendizaje automático?

Cómo elegir un tema de tesis doctoral en aprendizaje profundo

Creo que sí. Se trata solo del patrón, no debería ser muy difícil para la CNN darse cuenta de lo que necesita enfocarse.

De hecho, he hecho una CNN para aprender de un fondo mucho más confuso con algunos trucos. Puedes echar un vistazo a mi trabajo aquí (Select-Additive Learning), pero diré que probablemente no necesites estos trucos elegantes.

Por cierto, ¿dónde encontraste este conjunto de datos?

Toni Bellamo

Creo que debería “funcionar” tal como es porque las funciones de nivel superior se encargarán de ello.

Si tuviera más tonos, probablemente querría usar algún tipo de “blanqueamiento” (PCA o ZCA).

Toni Bellamo

More Interesting

¿Cuál es la maldición de la dimensionalidad?

¿Cuáles son algunos algoritmos de corrección ortográfica que usan los motores de búsqueda? Por ejemplo, cuando utilicé Google para buscar "imágenes de Google", me preguntó: "¿Quiso decir: imágenes de Google?".

¿Dónde puedo encontrar cursos de aprendizaje automático y redes neuronales en la web?

En la optimización matemática, ¿por qué alguien usaría el descenso de gradiente para una función convexa? ¿Por qué no encontrarían simplemente la derivada de esta función y buscarían el mínimo de la manera tradicional?

¿Cómo comenzarías en Computación ubicua y programación para ello?

Cómo realizar el aprendizaje de refuerzo en una red neuronal de alimentación oculta de capas múltiples