¿Por qué Google publica un tutorial y el código sobre cómo construir su propio sistema de traducción automática neuronal en su blog de investigación en GitHub?

Este código ya ha sido abierto por otros investigadores de la PNL, y las diversas ideas técnicas relevantes también están disponibles en documentos técnicos sobre arXiv, por ejemplo, el trabajo de vanguardia [1] de Facebook AI Research. Del mismo modo, hay conjuntos de datos de traducción académica, incluidos los conjuntos de datos WMT’14 ya presentes en el dominio público.

Por otro lado, para hacer que tal sistema alcance los niveles de precisión del Traductor de Google, uno necesitaría acceder a los conjuntos de datos propietarios mucho más grandes de Google, que no se han hecho públicos.

Aún así, ¿qué hay para Google?

Primero, publicar investigaciones y códigos les permite obtener los mejores investigadores e ingenieros para sus equipos. Esto hace una gran diferencia, porque estos problemas están muy abiertos, y solo un puñado de laboratorios académicos en el mundo son realmente competitivos en ellos. Este puñado de laboratorios produce en total una docena o un par de docenas de buenos doctorados de PNL al año. Dicha visibilidad y promesa de impacto se convierte en un factor importante cuando deciden entre ofertas de trabajo. Tenga en cuenta que estas personas no necesitan ir a Google. ¡Otros empleadores potenciales, por ejemplo, aquellos en Wall Street probablemente les pagarán un orden de magnitud más!

En segundo lugar, proporcionar un código de referencia para NMT y otros problemas, atrae a investigadores activos y desarrolladores de software a TensorFlow; lo que con el tiempo dará como resultado mejoras rápidas en TF. TF ya es el marco de referencia de aprendizaje profundo, en gran parte debido al interés académico en él. ¡Tenga en cuenta que CNTK salió con aprendizaje distribuido antes que TF, y fue superior en rendimiento hace dos años! Los académicos líderes aún acuden a TensorFlow precisamente por el efecto comunitario.

Finalmente, Google quiere convertirse en un jugador en el mercado de la nube, donde actualmente está a la zaga de Amazon y Microsoft. TensorFlow tiene el potencial de atraer más negocios empresariales a la plataforma en la nube de Google. ¡Ahí es donde está el gran dinero!

[1] https://arxiv.org/pdf/1705.03122…