¿Por qué nadie ha escrito un traductor de idiomas perfecto?

La traducción es más que el proceso de aplicar reglas automáticamente. La traducción no es en absoluto un problema trivial como la entrada de datos. Es una tarea creativa.

La traducción es el procesamiento de ponerse en el lugar del autor original y descubrir qué dirían si hablaran el idioma de destino. Traduces la situación, no las palabras, y eso requiere tres cosas que las computadoras no tienen, y hasta ahora simulan bastante mal: empatía, imaginación y comprensión de la situación, el tema o la historia en cuestión.

Además, en un nivel puramente técnico, hay muchas referencias de largo alcance para distinguir y realizar un seguimiento.

Este no es un problema trivial. Este es un gran problema difícil. La computadora que podría resolverlos podría pasar una prueba de Turing. En principio es solucionable, pero en la práctica me imagino que la forma más fácil de hacerlo será hacer algo que se comporte muchísimo como un cerebro humano. Es decir, probablemente dependería más del procesamiento en paralelo que de la ejecución en serie, sería analógico o al menos se basaría en una lógica difusa y estaría entrenado en lugar de programarse explícitamente. El reciente movimiento hacia la traducción estadística es un paso en esta dirección.

Por cierto, este es el problema, siempre me pareció, con el experimento mental de Searle’s Chinese Room. Searle parece ignorar la gran dificultad de crear un conjunto de reglas simples, discretas y consecutivas para generar respuestas convincentemente humanas a las consultas en chino, y esto siempre me pareció sospechoso y engañoso.

Un traductor de idiomas perfecto solo puede ser una cosa. Tendría que ser un agente inteligente que sea fluido en ambos idiomas, que pueda hacer preguntas para aclarar el significado deseado, y que pueda comprometerse intuitivamente en función de lo que puede y no puede traducirse de manera eficiente o significativa.

Los idiomas no se traducen como la mayoría de la gente supone que lo hacen. Son mucho más que símbolos que componen declaraciones. Todos los idiomas codifican comportamiento, tradición y creencia común. Los idiomas implementan la cultura y ayudan a sus miembros en cómo piensan. Piensa en cómo piensas. ¡Piensas en un idioma!

Es difícil traducir idiomas porque es difícil traducir cultura:

  • El japonés tiene honoríficos que están destinados a ser utilizados cuando se habla con cualquier persona mayor, superior o cualquiera que sea un extraño, por principio.

Es difícil traducir distinciones que no se hacen en un idioma:

  • El japonés no tiene plurales ni artículos.
  • El japonés solo tiene un sonido para R y L, B y V.

También es difícil traducir palabras cuando no existen.

  • El japonés tiene 50 palabras para la lluvia: ¿Por qué el japonés tiene 50 palabras para la lluvia?
  • Algunos idiomas no tienen palabras para azul: distinción de azul y verde en varios idiomas

Soy lo suficientemente afortunado como para hablar inglés y japonés de forma nativa, de ahí los ejemplos anteriores, pero pregunte a cualquier bilingüe bicultural y tendrán muchos ejemplos.

Las lenguas abarcan las culturas. Cuando dos culturas se superponen, el lenguaje es bastante fácil de traducir. Donde no lo hacen, no hay traducción fácil, si la hay. Es por eso que tener dos diccionarios está lejos de ser suficiente. Saber toda la gramática tampoco es suficiente. Esa fue la parte fácil que hemos dominado hace un tiempo. Pero desde entonces, hemos topado con un obstáculo importante: la cultura. Las culturas extranjeras son difíciles de comprender incluso para nosotros los humanos, y es mucho más difícil de estructurar y procesar como datos para computadoras. Pero no solo eso, donde las culturas no se superponen, no hay traducciones. Un extranjero no sabrá nada de lo que se está hablando, y tendrá que ser educado sobre la cultura en su propio idioma para comprender verdaderamente el contexto y el significado de cualquier declaración culturalmente única. Y cada cultura es única.

El inglés es un buen idioma global porque no tiene restricciones culturales tradicionales. Por lo tanto, es más fácil ir al inglés desde cualquier idioma, aunque se puede perder mucho en la traducción. Por otro lado, el inglés también es extremadamente bueno para articular conceptos abstractos con un lenguaje simple. Esto puede dificultar la traducción de conceptos, ya que las palabras no existirán o no se combinarán para formar los mismos significados o matices que en inglés.

Aunque la cultura sigue siendo la pieza más grande que falta para la traducción automática, ha habido algo de innovación. Un método es la consideración de casos de uso y la asociación de grupos a esos casos. Este método también se ha mejorado al retener el contexto de las palabras y oraciones circundantes. Por ejemplo, “buenos días” no tiene nada que ver con si la mañana es buena o no. Es lo que decimos cuando nos encontramos con alguien en la mañana para saludar, y por la tarde, decimos “buenas tardes”. A medida que estos sistemas mejoran, los datos se hacen más grandes y los algoritmos se vuelven más complejos, y se necesitan más recursos computacionales. Pero todo esto lleva a agentes inteligentes que pueden tomar las decisiones correctas, lo que sería la definición misma de inteligencia artificial.

Para cuando hayamos terminado, tendremos un robot de IA con fluidez en todos los idiomas y culturas. Pero hasta entonces, los únicos traductores de idiomas perfectos tendrán que ser humanos.

Porque para hacerlo necesitarías resolver el problema general de la inteligencia artificial. No es cierto que hayamos resuelto problemas que son “mucho más difíciles” que traducir perfectamente entre dos lenguajes naturales, ni mucho menos.

Considere el caso patológico de la sintaxis y la semántica en inglés en el que se observa que ” Buffalo buffalo Buffalo buffalo buffalo buffalo Buffalo buffalo ” se puede analizar como una oración legal, citando Wikipedia:

[La oración] se lee como una afirmación de que los bisontes que son intimidados o intimidados por bison son ellos mismos intimidadores o intimidantes (al menos en la ciudad de Buffalo, implícitamente, Buffalo, NY):

  1. Buffalo Buffalo (Buffalo de Buffalo NY) [que] Buffalo Buffalo Buffalo (que el Buffalo de Buffalo NY intimidan) Buffalo Buffalo Buffalo (están intimidando a Buffalo de Buffalo NY)
  2. [Esos] búfalos de Buffalo [que se sienten intimidados por] búfalos de Buffalo intimidan a búfalos de Buffalo.
  3. Los bisontes de Buffalo, Nueva York, que se sienten intimidados por otros bisontes en su comunidad, también intimidan a otros bisontes en su comunidad.
  4. El búfalo de Búfalo que es búfalo ed por búfalo de Búfalo, búfalo (verbo) otro búfalo de Búfalo.
  5. Buffalo Buffalo (sujeto de la cláusula principal) [that] Buffalo Buffalo (sujeto de la cláusula subordinada) Buffalo (verbo de la cláusula subordinada) Buffalo (verbo de la cláusula principal) Buffalo Buffalo (objeto directo de la cláusula principal).

La oración se puede aclarar sustituyendo el sinónimo “bisonte” por el animal “búfalo”, “matón” por el verbo “búfalo” y “Nueva York” para referirse al estado de la ciudad Búfalo:

  • “Bisonte de Nueva York Bisonte de Nueva York matón, matón Bisonte de Nueva York”, o:
  • “Bisonte de Nueva York que otros bisontes de Nueva York intimidan, ellos mismos intimidan a los bisontes de Nueva York”.

Cualquier software que traduzca perfectamente el inglés tendría que traducir la oración Buffalo correctamente. Creo que está bastante claro que hacer esto requeriría inteligencia a nivel humano y, por lo tanto, la traducción perfecta es un ejemplo de un problema completo de IA.

Este es un ejemplo artificial, pero los tipos de ambigüedad que vemos arriba surgen en todos lados cuando tratamos con lenguajes naturales.

No solo nadie ha escrito un traductor de idiomas perfecto, no existe una traducción perfecta. Incluso los mejores traductores varían en cómo traducen el material. Este es menos el caso en material altamente técnico, y la mayoría del caso en material altamente contextual como la poesía.

Vladimir Nabokov, quien estaba tan calificado como cualquiera para opinar sobre esto, dijo

Leer poesía en traducción es como besarse a través de un velo

Su subtítulo subestima enormemente la dificultad de la traducción.

Tomemos un ejemplo simple: en hebreo, para preguntar cómo está alguien, uno dice:

“¿Ma shlomcha?”

pero si le preguntas a una mujer dices

“¿Ma shlomech?”

Esta frase banal plantea al menos dos cuestiones:

Género: el inglés no tiene forma de distinguir estas frases sin sonar ridículo: “¿Cómo estás (mujer)?”

Connotación: el inglés contiene el verbo “to be”. El hebreo no tiene verbo y, literalmente, significa “¿cuál es el SHALOM de ti?” pero “shalom” significa varias cosas en hebreo y no tiene un equivalente exacto en inglés.

El hebreo tiene binyanim en verbos; más o menos como los casos. El inglés no. Entonces, lilmod – aprender está directamente relacionado con lelamed – enseñar de maneras que “enseñar” y “aprender” no lo están; Además, Lelamed es el causante de Lilmod. El inglés no tiene una forma real de traducir esto: “Él lo hizo aprender” es ridículo.

Porque para hacerlo necesitarías resolver el problema general de la inteligencia artificial. No es cierto que hayamos resuelto problemas que son “mucho más difíciles” que traducir perfectamente entre dos lenguajes naturales, ni mucho menos.

Considere el caso patológico de la sintaxis y la semántica en inglés en el que se observa que ” Buffalo buffalo Buffalo buffalo buffalo buffalo Buffalo buffalo ” se puede analizar como una oración legal, citando Wikipedia:

Recientemente se topó con una aplicación de traducción de idiomas única en su tipo
Kick All Language Translator – Aplicaciones de Android en Google Play
AHORA, lo que era ÚNICO acerca de esta aplicación era que se podía abrir en cualquier aplicación, supongamos que está chateando con una persona de China. si normalmente usa una aplicación de traductor de idiomas, sería muy engorroso ya que debe copiar la prueba del chat y luego abrir el chat de traductor de idiomas y luego pegarlo … y traducir y luego debe volver a abrir la aplicación de traductor … así que s consume mucho tiempo ..
Ahora considere este escenario … Está chateando con una persona de digamos china … y su traductor se abre sobre su chat … puede mover el diálogo del traductor sobre el chat a cualquier lugar … copiará el texto en el chat y se pegará automáticamente en
traductor y VOILA traducido
NO es necesario abrir la aplicación de traductor una y otra vez.
Fue simplemente una aplicación increíble.

No existe una traducción perfecta.
Toda traducción es un compromiso, incluso el realizado por humanos.
¿Por qué hay múltiples traducciones de obras clásicas extranjeras, si hubiera una sola forma correcta?

Un proceso automático tiene la desventaja adicional de no ser humano y, por lo tanto, no poder relacionarse con sujetos humanos. La expresión en el lenguaje ya es una ‘traducción’ de la imaginación y la experiencia personal. Para traducir ese ‘sistema de traducción’ de manera efectiva en otro ‘sistema de traducción’, debe ser capaz de empatizar con los idiomas y las culturas y personas subyacentes.
Algo que un algoritmo solo puede simular muy muy superficialmente.

No es fácil para nadie escribir un traductor de idiomas perfecto, ya que es bastante difícil escribir modismos, frases y traducir a otro idioma exacto. Es por eso que la gente busca traductores profesionales para traducir sus documentos profesionales.

Como sabemos, no existe una traducción perfecta.

La traducción es un compromiso, incluso el realizado por humanos o herramientas.

¿Por qué hay múltiples traducciones de obras clásicas extranjeras, si hubiera una sola forma correcta?

Recurso: http://www.tridindia.com

Un traductor de idiomas perfecto requeriría una computadora para comprender lo que se dice en el idioma.

Los mejores traductores que tenemos se basan en estimaciones estadísticas basadas en el análisis de una gran cantidad de traducciones.

Ahora, entender el lenguaje es un problema difícil. Se requeriría al menos un muy buen modelo cognitivo, y no tenemos uno ahora. Incluso entonces, los traductores humanos encuentran el problema extremadamente difícil.

Dicho esto, parece que estamos más retrasados ​​en el desarrollo de la generación, comprensión y traducción del lenguaje automatizado de lo que parece que deberíamos, en comparación con esos otros avances. Creo que hay una razón para esto, y su nombre es Noam Chomsky. Utilizó su política e influencia personal para avanzar en un modelo simplista de lenguaje que está bastante mal, y también avergonzó a la gente para que no buscara alternativas. El otro lado desafortunado del prestigio es que la investigación popular y carismática con un buen historial puede perjudicar un campo. Afortunadamente, los científicos cognitivos no se avergonzaron de la existencia y están progresando, aunque, según mi estimación, se retrasaron unos 30 años.

Es bastante bueno que Chomsky se preocupe por la política, que parece ser un lugar donde los viejos lingüistas van a morir en una situación siniestra, porque lo mantiene alejado de la ciencia legítima. Sin embargo, incluso George Lakoff parece estar tomando una ruta política en estos días.

Ningún humano ha hecho aún una traducción correcta. ¿Por qué? Está la cuestión de la ambigüedad. La escritura y las expresiones no siempre son claras e inequívocas. Cuando se puede extraer más de un significado de algo escrito o pronunciado allí, el traductor elegirá el equivocado.

El resultado final: las máquinas no piensan como los humanos. Ni siquiera cerca.

Todavía no hemos encontrado un buen modelo de significado de oraciones, lo que requerirá ser bastante riguroso sobre la estructura del pensamiento. Las empresas de la ciencia y la filosofía están teniendo problemas para establecerse, aunque los avances en la ciencia cognitiva eventualmente deberían ser el contexto que necesitamos.

Porque la forma en que los humanos aprenden y usan el lenguaje es muy diferente de la forma en que lo hace la máquina. La gramática de cualquier idioma no podría resumirse en un conjunto de reglas contablemente finito que podrían aprenderse y entrenarse en la máquina. Siempre hay excepciones y la misma expresión del lenguaje se usa de manera diferente en diferentes contextos por las personas. Es difícil modelar la forma en que los humanos perciben y responden a un idioma. Por cierto, ¿estás interesado en crear un traductor mucho mejor que el que tenemos ahora? Los lingüistas pueden ser de alguna ayuda para usted.

El lenguaje tiene dos usos generales:
1. Información de transporte
2. Seducir (generalmente el sexo opuesto, pero también puede incluir entretenimiento).

Cuando una prosa tiene que hacer la primera función, es simple. Fácil de traducir
Cuando una prosa tiene que hacer las segundas funciones, es compleja como la poesía.
La poesía es siempre compleja, con lo mismo que transmite un significado diferente en diferentes entornos.

Lo mismo con diferentes idiomas.
Un lenguaje inventado (desarrollado) para transmitir información tiende a ser bastante simple. Inglés, hindi. De ahí la gran capacidad de traducción de la computadora.

Un lenguaje desarrollado principalmente para seducir, es complejo y, por lo tanto, difícil de traducir. verbigracia. Bengalí, Malyali. Hubiera incluido el francés, pero la educación formal es una perra que escucho.

PD: Los idiomas de áreas densamente pobladas son complejos, difíciles, mientras que las áreas escasamente pobladas parecen simples, por razones obvias. Comenta si no entiendes lo obvio.

Como la mayoría de las veces uno podría ser técnicamente correcto en la forma en que traduce un texto, pero puede no transmitir la sensación y el espíritu del texto. Como vemos en lo anterior, en un contexto más amplio, un traductor verdaderamente realizado de cualquier texto o tema no transforma simplemente las palabras de un idioma a otro. Es muy dificil.

More Interesting

¿Estaba mal que la comunidad de IA bromeara sobre el lanzamiento de la compañía RocketAI?

¿Cuánta potencia informática requiere un robot inteligente general?

¿JARVIS pasaría la prueba de Turing?

¿Qué posibilidades hay de que los robots de ancianos cuiden en el futuro cercano?

¿Las formas de vida artificial no estarían sujetas a la ley con respecto a crímenes como hurto y asesinato en primer grado?

¿Hay algún dispositivo doméstico disponible en el mercado en este momento que use una IA?

¿Qué tan factible es el robot doméstico 'Mab' enjambre limpiador doméstico?

¿Se puede diseñar una prueba de coeficiente intelectual para medir la inteligencia de un sistema de IA?

¿Cuál es el cerebro de organismo más complejo que podemos imitar con éxito con la tecnología actual de IA?

Cómo hablar con los laicos sobre la IA cuando inmediatamente comienzan a hablar sobre la inevitabilidad de los robots que se apoderan del mundo a la Skynet

¿Puedo inscribirme en un nanogrado de inteligencia artificial de Udacity con cero conocimientos en aprendizaje automático, inteligencia artificial o aprendizaje profundo?

¿Crees que un salario base universal es inminente con la evolución de la inteligencia artificial?

¿Por qué algunas personas están a favor de la IA?

¿Qué CPU es suficiente para ejecutar un robot humanoide?

¿En qué se diferencia un ingeniero de software de aprendizaje automático con más de 3 años de experiencia de un doctorado sin experiencia en ML para resolver problemas a escala de Google? ¿Qué ventajas tiene la persona con experiencia? ¿Qué diferencias en el resultado podemos esperar?