¿Cuáles son los problemas abiertos en el sistema de traducción basado en el aprendizaje automático?

Los problemas dependen del tipo de aprendizaje automático que utiliza el sistema de traducción específico. Para comprender los problemas que necesita para familiarizarse con la mecánica de la traducción de aprendizaje automático:

Hablando sobre: ​​método de traducción automática estadística:

Como su nombre ya sugiere: este tipo de traducción depende del aprendizaje automático a través de datos estadísticos sobre cómo los humanos usan y traducen las oraciones. Cuantos más datos tenga, mejor será su texto traducido.

Se desarrolla un problema cuando simplemente no hay suficientes datos para que la máquina aprenda. Por ejemplo, rara vez se utilizan idiomas de algunas islas pequeñas. Sus sugerencias probablemente no sonarán a humano. Tendrá problemas para elegir las traducciones correctas sin un traductor (humano) adicional. Puede consultar este artículo de uno de mis colegas: por qué la traducción humana auténtica sigue siendo esencial.

El método del futuro:

Traducción automática basada en el aprendizaje automático mediante aprendizaje profundo: los sistemas de traducción basados ​​en el aprendizaje automático mejorarán cuando la máquina aprenda mejor el lenguaje humano. En lugar de traducir por oraciones al desglosarlo y calcular la posibilidad mediante el uso de estadísticas, funciona con oraciones completas (repito: sin desglose de la oración).

Por ejemplo: el traductor de Google recibió una gran actualización, que utiliza una llamada red neuronal para las traducciones automáticas. Se supone que reduce los errores en un 60%, Fuente: Google Translate obtiene una actualización de aprendizaje profundo)

Conclusión:

Por lo tanto, los errores de traducción seguirán representando un problema para los sistemas de traducción base de aprendizaje automático, siempre que el aprendizaje profundo no se perfeccione y se difunda ampliamente.

Recomiendo este artículo para una lectura y comprensión más detalladas: el aprendizaje automático es divertido Parte 5: Traducción de idiomas con aprendizaje profundo y la magia de las secuencias

Espero que esta respuesta haya sido útil. Estoy seguro de que hay otros problemas, no lo mencioné, así que no dude en agregar su respuesta. También puede optar por ponerse en contacto conmigo para obtener más ayuda.

Descargo de responsabilidad: soy parte del equipo de PhraseApp. Las opiniones son mías.

PhraseApp es un sistema de gestión de traducción, que ayuda a que su proceso de localización sea mejor y más rápido.

¿Quieres ver PhraseApp en acción? Aquí está la página de demostración. ¿Prefieres un video de descripción general (está en nuestra página principal)

Y para aquellos que quieran probarlo: Obtenga su prueba gratuita de 14 días ahora.

Aquí hay algunos beneficios:

  • Llegar a audiencias globales
  • Automatizar tareas de localización
  • Ahorre hasta un 60% en tiempo de proceso

Depende de los idiomas con los que esté tratando. Por ejemplo, si está realizando una traducción automática del inglés a los idiomas europeos y viceversa, entonces ese problema está bastante resuelto. Sin embargo, si la traducción se lleva a cabo entre inglés y devnagiri (hindi / marathi), entonces presenta el problema de Code Mix, donde el hindi generalmente consiste en algunas palabras en inglés y su identificación, etc. La identificación del idioma en código mixto devnagiri script es uno de esos problemas abiertos en los que estoy trabajando actualmente. Aquí está mi artículo que se refiere a otros trabajos que ya han funcionado bastante bien pero no con una precisión del 100%.

https://www.researchgate.net/pub