Se informó que un método desarrollado por Kato et al en 1999 tenía una tasa de éxito del 99,42% en el reconocimiento de caracteres chinos, como se describe en su documento (enlace a continuación).
El método de Kato utiliza características de elementos direccionales (DEF) . Estos se generan al encontrar el contorno de una imagen de personaje, reducir el muestreo y luego el vector de características se construye a partir de las direcciones del contorno en un sobremuestreo de parches superpuestos. Este proceso se describe en detalle en la Sección 3 del documento de Kato.
El método de Kato es contemporáneo. Uno de mis TA publicó un documento este año (¡2014, que está por terminar!) En el que utilizó dicho método.
- ¿Cuáles son los tipos de máquina?
- Cómo visualizar un clasificador durante su entrenamiento
- ¿Quién es el mejor científico de aprendizaje automático del mundo?
- Cómo explicar claramente el aprendizaje profundo a alguien con antecedentes matemáticos limitados
- ¿La normalización de lotes hará la diferencia al entrenar con tamaño de lote = 1?
¿Es este el mejor método de extracción de características? No es seguro. Pero se ve bastante sólido.
Artículo de Kato et al .: Página en tohoku.ac.jp
Documento de Y. Zhu sobre la generación de caracteres chinos: página en stanford.edu