La pregunta es:
¿Cómo trata Google Translate u otra traducción en línea con palabras que no existen en el otro idioma?
Lo cual, para mí, es diferente de:
¿Qué tan bueno es Google Translate para tratar con palabras que no existen en el otro idioma?
Por lo tanto, en mi opinión, responder ” es bueno ” o ” bastante malo ” está fuera de tema.
Por lo tanto, me centraré en cómo funciona el Traductor de Google y qué puede hacer frente a palabras que no existen.
- ¿Es GitHub o GitLab más adecuado para una empresa de ciencia de datos / ML?
- ¿El aprendizaje automático como campo todavía está en su infancia, o ya es sofisticado y está bien desarrollado?
- ¿Por qué la supercomputación no se utilizó con éxito para Deep Learning anteriormente?
- ¿Debo comenzar a aprender Python y el aprendizaje automático al mismo tiempo?
- ¿Cuáles son algunos marcos de aprendizaje profundo con solo CPU?
Google trabaja la traducción automática usando la red neuronal.
El objetivo de tales técnicas es obtener una distribución de probabilidad. Esto significa que, dada una palabra en un idioma de origen , y teniendo la tarea de traducirla a otro idioma de destino , no aprenderá una traducción como los humanos
“Bateau” (fr) = “bote” (en)
En cambio, aprenderá la probabilidad entre la palabra fuente y cada palabra objetivo. Lo cual, volviendo a nuestro ejemplo daría:
” Bateau ” (fr) = (en) ” barco ” (50%), ” barco ” (40% “), …
Uno puede hacerlo alineando el texto ya traducido (en el que podemos confiar) como sitios web y libros. El sistema no te dice “oh, ‘bateau’ (fr) es ‘barco’ (en)” sino que:
(Por lo general ) encuentro “barco ” en textos en inglés en el mismo lugar que ” bateau ” está en inglés. Puede ser la misma palabra entonces. Y lo mismo se aplica (con menos frecuencia ) para ” enviar”. Deberías usarlos, ya que siento que cualquier otra palabra es muy poco probable que esté aquí.
Dicho esto, ¿qué cambia?
Lea la última cita nuevamente. Todo lo que hace el traductor es seleccionar del vocabulario objetivo, las mejores probabilidades. No importa si existe la traducción literal, ya que devolverá lo que generalmente se usa para decir la palabra. Mientras alguien hable, de una forma u otra sobre el concepto, la traducción existirá.
Entonces, ¿qué pasa si la palabra no existe?
Nada cambia. Imagine que el inglés no tiene “barco” o “barco”. El traductor puede devolver:
“Bateau” (fr) = “un vehículo flotante”, “embarque”,
y básicamente cómo los ingleses están hablando de esta cosa sin nombre.
Limitaciones
Ese era un punto de vista bastante teórico para explicar cómo hace lo que hace. Todavía se están realizando investigaciones en este campo (y se usa siempre más ese tipo de enfoque) y puede que no sea perfecto. Tener suficientes datos buenos y procesarlos de la manera correcta no es nada fácil.
Espero eso ayude,
Como siempre, avíseme si tiene preguntas / sugerencias sobre el contenido / idioma, etc.
pltrdy