¿Cuál es el mejor enfoque para adivinar los diacríticos árabes mediante programación?

Su primera pregunta probablemente debería ser si existe alguna ambigüedad o no: para una oración dada en árabe estándar, ¿hay exactamente una manera de agregar los signos diacríticos, o hay varias formas válidas con diferentes significados?

Si es lo último, esencialmente debe aceptar que a veces estará mal, lo que implica darle al usuario una forma de corregirlo. No importa la cantidad de datos que tenga una red neuronal, no puede predecir lo que piensa el usuario; lo mejor que puede hacer es proporcionar la versión más común. Así es como funciona el texto predictivo: puede haber varias palabras, por lo que las enumera en orden de probabilidad.

Si es lo primero, una red neuronal podría funcionar para esto, siempre que tenga un gran cuerpo de oraciones que sean idénticas, traducidas correctamente a ambas formas, en un formato amigable para la computadora.

También necesitaría decidir cuál es el tamaño de representación apropiado: ¿puede asignar palabras en una a palabras en la otra? ¿O las combinaciones de palabras en árabe estándar interactúan para producir diacríticos diferentes de los que vería con cada palabra individualmente?

Suena como un problema desafiante. Me pregunto si el traductor de Google puede hacer esto.

De hecho, puede probar sitios web en línea o aplicaciones móviles

* Como sitio web de internet puedes probar:

  1. Mishal es un código abierto escrito en Python. Puede probarlo en línea: مشكال النصوص العربية, ingrese su script en árabe y luego presione تشكيل.
  2. Multillect Harakat proporciona una API para agregar diacríticos. Puede probarlo en línea escribiendo su guión y luego presionando “vocalizar”.

Si desea una aplicación, pruebe: la aplicación Harakat (tienda de aplicaciones: Harakat en la App Store) (Android Harakat – Aplicaciones de Android en Google Play)

Nota importante: tenga en cuenta que estos sitios web no son 100% precisos. Encontrarás varios errores, aunque prefiero usar más la aplicación Harakat y el sitio web, debes decidir la importancia de tu script. Si es para su diversión o uso personal, entonces está bien. Pero si es por trabajo profesional o para aprender los diacríticos, entonces no recomiendo depender mucho de ellos. En cambio, aconsejaré usar la aplicación y pedirle a un usuario experimentado que la revise.

* Gracias Ilyas moussawi por las ediciones.

More Interesting

¿Necesita algoritmos para la interfaz de usuario?

¿Por qué el aprendizaje profundo requiere la construcción de modelos de datos generativos?

¿Cómo hacemos análisis de búsqueda binaria (matriz)?

¿Cuál es la diferencia entre un gráfico y un árbol en estructuras de datos y algoritmos?

¿Cuáles son algunos algoritmos nuevos e interesantes en bioinformática / informática genómica?

¿Se conoce algún algoritmo general para factorizar números muy grandes?

¿Escribir un algoritmo simple para verificar si el número dado es primo o no?

Cómo multiplicar elementos de matriz sin usar bucle

¿Cuáles son algunos algoritmos informáticos inspirados en la naturaleza?

Cómo elegir el mejor algoritmo de aprendizaje profundo o paquete R para un conjunto de datos

¿Cómo atravesar una matriz desde una posición dada vertical u horizontal o diagonalmente para encontrar un elemento en C ++? ¿Podría proporcionar un código de muestra?

¿Cómo puede Bulk Synchronous Parallel relajar las contracciones de sincronización de superpasos?

¿Cuál es el algoritmo más eficiente para descubrir el punto de silla de una matriz?

¿Tengo que hacer programación competitiva si estoy aprendiendo la estructura de datos y los algoritmos, mientras que la programación competitiva me distrae o primero tengo que aprender la estructura de datos y el algoritmo por completo y luego saltar a la programación competitiva?

¿Cuál es el proceso de ejecución exacto de imprimir permutaciones de cadena de forma recursiva?