¿Hay alguna manera / hay algoritmos para dividir los caracteres chinos en radicales?

¿Podría por favor aclarar la pregunta?

En primer lugar, ¿quieres decir componentes en lugar de radicales ? El radical de 唤 es 口 solamente; 奂 no es un radical de 唤.

En segundo lugar, ¿estabas buscando una funcionalidad basada en texto o una funcionalidad basada en imágenes?

Si un hombre está limitado por el conocimiento, ¿podemos crear un algoritmo para sus elecciones y determinar su futuro?
¿Qué tan difícil sería para un novato la 'Introducción a los algoritmos' de Thomas H. Cormen?
¿Qué estructura de datos debo usar en Java para almacenar y obtener el siguiente tipo de datos? ¿Cuál debería ser la estructura de mi clase para este propósito?
¿Cuáles son los actos que se consideran hacer trampa durante un desafío de contratación en Interviewstreet?
¿Es posible hackear usando el lenguaje de programación C?

Hasta donde yo sé, no existe tal programa que tome una imagen de un personaje y lo divida en componentes.

Si estaba buscando ingresar texto y dividir el texto en componentes de caracteres, entonces buscar un algoritmo programático para hacerlo no es la forma correcta de abordarlo. La naturaleza de los radicales es inherentemente arbitraria, con los estándares actuales derivados de una lista inventada incrustada en el diccionario Kangxi; No existe un algoritmo lógico que le permita tomar un carácter arbitrario y dividirlo en componentes. Toda la funcionalidad que hace esto en este momento (por ejemplo, el ejemplo dado por la respuesta de David Kamen) está en forma de bases de datos de búsqueda, con la información de cómo dividir los caracteres ya codificados para cada personaje.

Digamos que tienes una imagen de un texto. La forma correcta de dividirlo en radicales y componentes restantes es alimentarlo a través de una tubería de software que involucra:

Software óptico de reconocimiento de caracteres, que convierte la imagen en texto;
Alimentar el texto a una base de datos existente de caracteres chinos que contiene información radical / componente;
Hacer que la base de datos genere esta información.

No recuerdo haber encontrado ningún software que haga algo así automáticamente, pero en teoría no parece demasiado difícil de construir. El paso OCR es probablemente el más problemático.

Related Content

¿Cuáles son algunos avances en ciencias de la computación realizados por científicos mientras trabajaban en la industria?

Encuentre la suma máxima del subconjunto de longitud k de un conjunto dado, de modo que la suma sea estrictamente menor que M

¿Existen tipos de programas de software que involucren matemáticas, pero que puedan resolver problemas cotidianos (es decir, no un motor de juego de física completo o un nuevo algoritmo criptográfico)?

¿Cuál es el algoritmo utilizado para mostrar el orden de amigos que se muestra en toda la lista de amigos en Facebook?

¿Qué 'palabras' debo saber para resolver problemas de programación o problemas matemáticos relacionados?

Cómo configurar mi propia nube en mi PC

¿Qué es la búsqueda de fuerza bruta?

No conozco ningún “algoritmo” de análisis de caracteres independiente u otra herramienta web, pero algunos diccionarios en línea proporcionan esa información. Como ejemplo, para su carácter 唤, el diccionario 《漢典》 (www.zdic.net) da el radical 口 y el número de trazos en la parte no radical del carácter:

junto con su pronunciación estándar y varias formas no estándar (异体字), además de una gran cantidad de otra información interesante. Un posible inconveniente es que tiene que buscar en el diccionario carácter por carácter. ¿Quizás otros coroanos conocen mejores formas de extraer radicales de carácter?

David Kamen

More Interesting

¿Cómo entender el algoritmo SHA-1? ¿Cuáles son los mejores ejemplos para ello?

¿Cuál es la comparación en algoritmo de Sieve of Sundaram y Sieve of Eratosthenes con tiempo-complejidad?

¿Por qué conocer estructuras de datos y algoritmos básicos no es suficiente para descifrar la mayoría de las entrevistas técnicas?

¿Cuál es una manera simple de implementar la paginación en una matriz en Javascript?

¿Por qué los desarrolladores no se adhieren al algoritmo de prueba de trabajo de Bitcoin cuando desarrollan nuevas monedas?

¿Cómo un programa de razonamiento poco preciso asigna 8 gb de memoria en 3 segundos?

¿Cuál es el tiempo de ejecución del método sort () en la biblioteca de Colecciones?

Si pudiéramos reescribir las leyes del universo con el único fin de optimizar la computación, ¿cuáles serían estas leyes?

Supongamos que eliminamos un borde de un árbol de expansión y luego agregamos un borde diferente para que permanezca conectado. ¿Seguirá siendo un árbol de expansión?

¿Obtendría algún beneficio resolviendo los problemas del Proyecto Euler por la fuerza bruta?

¿Cómo funciona el algoritmo en LinguaLift?

¿Hay algún algoritmo de dirección de camino legible para humanos?

¿Qué debe aprender primero, algoritmos y DS o un lenguaje de programación?

Cómo hacer una selección aleatoria ponderada discreta en tiempo constante

¿Es posible tener análisis predictivos utilizando motores de recomendación? En caso afirmativo, ¿cuáles son algunos de los algoritmos de análisis predictivo utilizados por los motores de recomendación?

Web Analytics