¿Cuáles son los algoritmos principales detrás de Google Translate?

Básicamente, Google Translation utiliza una técnica llamada traducción automática estadística,
como sobre el modelo de simplificación puedes entenderlo como:
La base de datos está inundada de millones de traducciones de diferentes idiomas por humanos.
(Por ejemplo, un libro escrito en inglés y traducido por humanos en hindi) se inserta en la máquina, y un algoritmo luego encuentra patrones en él.

Ahora, según la cantidad de datos, el algoritmo lo traduce Al detectar patrones en documentos que ya han sido traducidos por traductores humanos (los libros que se traducen son ejemplos de traducciones humanas), la calidad de la traducción se produce mediante algoritmos.

Cuantos más documentos traducidos por humanos pueda analizar Google Translate en un idioma específico, mejor será la calidad de la traducción. Es por eso que la precisión de la traducción a veces varía según los idiomas.

La traducción adicional se mejora mediante un algoritmo de aprendizaje que aprende cuando un usuario ayuda a hacer una traducción correcta …

Vea esto para más aclaraciones:

Básicamente, Google Translate hizo un NN para tomar cualquier idioma como entrada y traducir a cualquier idioma . Los ingenieros de Google realizaron esta idea a finales de 2016. La arquitectura de NN se basó en el modelo seq2seq. La única excepción es que entre el codificador y el decodificador hay 8 capas de LSTM-RNN que tienen conexiones residuales entre capas con algunos ajustes de precisión y velocidad.

Lo principal de este enfoque es que ahora el algoritmo del Traductor de Google usa solo un sistema en lugar de un conjunto enorme para cada par de idiomas.

El sistema requiere un “token” al comienzo de la oración de entrada que especifica el idioma al que está tratando de traducir la frase.

Esto mejora la calidad de la traducción y permite traducciones incluso entre dos idiomas que el sistema aún no ha visto, un método denominado “Traducción de Disparo Cero”.

A partir de hoy, Google utiliza un modelo llamado Neural Machine Translation, donde un tipo de modelo recurrente basado en redes neuronales está entrenado para generar una secuencia de tokens a partir de otra secuencia de tokens (por lo tanto, traducción) [1].

Hasta donde sé, todavía no se envía para todos los pares de idiomas admitidos, ni tampoco en todos los países. Puede leer el documento original que explica la técnica aquí:

http://papers.nips.cc/paper/5346

[1] El gran despertar de la IA

More Interesting

¿Cuál es la diferencia entre 'Inferencia' y 'Estimación del modelo' en los documentos de LA?

¿Cuál es un ejemplo ilustrativo donde LDA y SVM dan límites de decisión diferentes?

¿Cuáles son algunos talleres sobre aprendizaje a gran escala?

¿Por qué utilizamos el CDF de distribución logística para calcular las probabilidades en la regresión logística?

¿Cómo es la aplicación K-Means de maximización de expectativas en Naive Bayes?

¿Qué otros algoritmos de aprendizaje automático, además del aprendizaje profundo, se aplican ampliamente en aplicaciones comerciales?

¿Por qué la longitud desigual del texto es un problema en el procesamiento del lenguaje natural?

En una máquina de vectores de soporte, el número de vectores de soporte puede ser mucho menor que el conjunto de entrenamiento. ¿Cómo puede ser útil esta característica?

¿Cuál es la mejor manera de encontrar análisis de sentimientos?

¿Cuál es una metodología sólida para abordar un problema de regresión?

¿Cuál es el mejor libro sobre Support Vector Machines?

¿Cuál es una buena secuencia de autoaprendizaje para el aprendizaje automático?

¿Cuáles son los tipos de problemas que se pueden resolver con las redes neuronales?

¿Cómo estimar la divergencia KL si no se conoce el posterior? En inferencia variacional, KL se utiliza para encontrar una distribución que se aproxime al verdadero posterior, pero el KL requiere conocer el posterior mismo. ¿Cómo se trata esto?

¿Hay algún lugar donde los métodos tradicionales de aprendizaje automático puedan vencer el aprendizaje profundo o las redes neuronales?