¿Cómo trata Google Translate u otra traducción en línea con palabras que no existen en el otro idioma?

La pregunta es:
¿Cómo trata Google Translate u otra traducción en línea con palabras que no existen en el otro idioma?

Lo cual, para mí, es diferente de:
¿Qué tan bueno es Google Translate para tratar con palabras que no existen en el otro idioma?

Por lo tanto, en mi opinión, responder ” es bueno ” o ” bastante malo ” está fuera de tema.
Por lo tanto, me centraré en cómo funciona el Traductor de Google y qué puede hacer frente a palabras que no existen.


Google trabaja la traducción automática usando la red neuronal.

El objetivo de tales técnicas es obtener una distribución de probabilidad. Esto significa que, dada una palabra en un idioma de origen , y teniendo la tarea de traducirla a otro idioma de destino , no aprenderá una traducción como los humanos

“Bateau” (fr) = “bote” (en)

En cambio, aprenderá la probabilidad entre la palabra fuente y cada palabra objetivo. Lo cual, volviendo a nuestro ejemplo daría:

Bateau(fr) = (en)barco ” (50%), ” barco ” (40% “), …

Uno puede hacerlo alineando el texto ya traducido (en el que podemos confiar) como sitios web y libros. El sistema no te dice “oh, ‘bateau’ (fr) es ‘barco’ (en)” sino que:

(Por lo general ) encuentro “barco ” en textos en inglés en el mismo lugar que ” bateau ” está en inglés. Puede ser la misma palabra entonces. Y lo mismo se aplica (con menos frecuencia ) para ” enviar”. Deberías usarlos, ya que siento que cualquier otra palabra es muy poco probable que esté aquí.


Dicho esto, ¿qué cambia?

Lea la última cita nuevamente. Todo lo que hace el traductor es seleccionar del vocabulario objetivo, las mejores probabilidades. No importa si existe la traducción literal, ya que devolverá lo que generalmente se usa para decir la palabra. Mientras alguien hable, de una forma u otra sobre el concepto, la traducción existirá.

Entonces, ¿qué pasa si la palabra no existe?

Nada cambia. Imagine que el inglés no tiene “barco” o “barco”. El traductor puede devolver:

“Bateau” (fr) = “un vehículo flotante”, “embarque”,

y básicamente cómo los ingleses están hablando de esta cosa sin nombre.


Limitaciones

Ese era un punto de vista bastante teórico para explicar cómo hace lo que hace. Todavía se están realizando investigaciones en este campo (y se usa siempre más ese tipo de enfoque) y puede que no sea perfecto. Tener suficientes datos buenos y procesarlos de la manera correcta no es nada fácil.

Espero eso ayude,
Como siempre, avíseme si tiene preguntas / sugerencias sobre el contenido / idioma, etc.

pltrdy

En realidad bastante mal. Pero recientemente, en noviembre de 2016, Google anunció la traducción neural con el sistema de traducción automática multilingüe de Google, que básicamente evita la traducción minuciosa de estructuras duales de lenguaje individual al traducir frases de entrada a representaciones vectoriales distribuidas de sus supuestos significados independientemente del idioma o idiomas que se preguntan en esa consulta o pregunta. Utilizan redes neuronales recurrentes (RNN) que se sabe que funcionan bien en secuencias (de palabras y frases). Al utilizar este enfoque, Google ha podido mejorar continuamente la calidad de las traducciones al permitir que sus sistemas tengan en cuenta no solo las palabras con orígenes y frases, sino también contextos más amplios de dónde aparecen en las oraciones, su etimología y las frases que las rodean. Estas representaciones vectoriales distribuidas de palabras se denominan en realidad incrustaciones de palabras. Mikolov descrito en el sorprendente artículo Word2Vec como un sistema para mapear palabras a vectores en un espacio real multidimensional de relativamente baja dimensionalidad que puede ser de unos pocos cientos. Este sistema no es realmente un sistema de aprendizaje profundo, ya que no se basa en redes neuronales artificiales multicapa. El mecanismo funciona como incrustaciones de palabras con significados similares que están muy juntas en el conjunto de espacios objetivo que, en realidad, como enfoques sintácticos producen salidas de diferentes asignaciones incluso en pequeñas diferencias. La traducción multilingüe de Google se basa en la misma técnica que Word2Vec.

El traductor de Google no es gran cosa.

Debe ser gramaticalmente preciso para obtener la traducción correcta.

Y las palabras que no están presentes en los idiomas a traducir se dejan intactas en el mismo idioma si Google no entiende el significado de las mismas.

Mal. La traducción al español en Google se actualizó recientemente, y es mejor, pero por ejemplo ‘sobremesa’ se traduce como ‘postre’. Esta traducción es horriblemente mala, expresa algo completamente diferente. ‘ambientación’, la palabra usada para hablar de personas que tocan música en el fondo de una fiesta, etc., se traduce como ‘escenario’. No hay otras traducciones. Luego están las traducciones cómicas, ‘sobrado’, que es como ‘demasiado’, ‘excesivamente’, se traduce como ‘casa’. A veces simplemente no traduce la palabra en absoluto. Es muy común en las lenguas eslavas simplemente transcribir lo que se escribió en letras latinas, sin proporcionar traducción. El árabe ni siquiera transcribe. Mientras tanto, el traductor de Cebuano es completamente inútil, nunca lo he visto traducir correctamente una oración completa, principalmente da lo que estaba escrito en Cebuano en Cebuano, pero en un orden diferente.

Lo último que escuché, Google Translate engaña.

No traduce como lo haría un humano, intercambiando palabras por sus equivalentes en otros idiomas. En cambio, mantiene una gran pila de palabras y asociaciones con otras palabras … no voy a escribirlo porque está aquí: ¿Cómo funciona el traductor de Google? ¿Tienen una base de datos para todas las palabras de un idioma en particular?

Entonces, si la palabra no existe, eso podría no importar mucho a Google. La oración con la palabra no coincidente proporcionará suficiente contexto para que Traducir adivine.

Bastante mal. He escrito una tesis sobre la comparación de la traducción humana y la traducción en línea como Google one. No tradujo palabras y las dejó como estaban o dio una traducción de significado totalmente diferente.

editar. Una de las traducciones que analicé fue un cuento de hadas para niños. Hubo algunos dichos como “tenía un escape estrecho” que casi en ruso suena como “apenas me quitó los pies” si se traduce literalmente. Creo que el traductor de Pragma no tradujo la mitad de eso. Y por alguna razón, hizo que pareciera que se volaron los pies.
Хохол – khokhol * – cresta. A través del traductor de Google obtuve “ucraniano” en lugar de cresta. Y ese momento fue sobre el pájaro caminando con una cresta en la cabeza.

  • es el estilo de corte de pelo cosaco ucraniano estereotípico que presenta un largo mechón de cabello que queda en la cabeza completamente afeitada, que generalmente brota de la parte superior o frontal de una cabeza afeitada. Se usa comúnmente como un término peyorativo para los ucranianos étnicos.

Sí, porque se ocupan de la forma oficial y formal de la lingüística.
La gente conocerá la forma de hablar menos verbal y más precisa de ese idioma. Las palabras pueden no existir en la forma moderna de la causa del idioma respectivo debido a la mezcla de idiomas.

Su pregunta me hizo sentir curiosidad, así que traté de pensar en una palabra en inglés que no esté exactamente en otros idiomas pero que posiblemente tenga una traducción suelta. La palabra “chav” vino a mi mente.

Al traducir al español, griego, maorí y francés, “chav” se asigna a “chav”. Las oraciones como “él es un chav” se asignan a oraciones equivalentes con la palabra no traducida en el lugar gramatical apropiado, por ejemplo, en español “él es un Chav”.

Creo que esta es probablemente la mejor solución. No hay interpretaciones falsas; solo se rinde. Si está utilizando el traductor de Google para fines prácticos y traduce todas las palabras, excepto algunas, puede cambiar del traductor de Google a la búsqueda de Google para encontrar lo que significan.

More Interesting

¿Cuántos 50 mg / ml hay en un vial de 10 ml de EP?

¿Por qué Quora eligió a HackerRank como plataforma para organizar sus competiciones de ML en lugar de algún sitio más familiar como Kaggle?

¿Qué recursos debo usar para comenzar a aprender Machine Learning durante el verano con mi educación actual?

Cómo comprender mejor las funciones de activación en el aprendizaje automático, especialmente las matemáticas detrás de ellas

¿Qué es la regresión de Ridge en términos simples?

Cómo guardar un modelo de red neuronal de convolución después del entrenamiento

¿Cuál es la mejor manera de manejar un modelo multitarea si las etiquetas de datos de capacitación tienen NA, es decir, no se analizaron todas las muestras para todas las tareas?

¿Puedo entrenar una red neuronal convolucional (CNN) con imágenes de fondo diferente en blanco y negro?

Para las selecciones de características, ¿cuál deberíamos preferir, PCA (basado en la matriz de correlación) para reducir la dimensión o Xgboost (basado en el árbol)?

¿Necesitamos aplicar una prueba de significación estadística en el aprendizaje automático?

¿Qué has aprendido haciendo investigación?

¿Cuáles son los dominios en los que las técnicas de aprendizaje profundo podrían aplicarse además del procesamiento de la visión por computadora y el lenguaje / habla?

¿Dónde puedo encontrar guías de aprendizaje automático desde la perspectiva de los hackers?

Cómo lidiar con una matriz escasa de pares de elementos de usuario mientras se construye un sistema de recomendación de filtrado colaborativo basado en perceptrón

Visión por computadora: ¿cómo sé qué vector de características en un vector combinado es más confiable?