Este código ya ha sido abierto por otros investigadores de la PNL, y las diversas ideas técnicas relevantes también están disponibles en documentos técnicos sobre arXiv, por ejemplo, el trabajo de vanguardia [1] de Facebook AI Research. Del mismo modo, hay conjuntos de datos de traducción académica, incluidos los conjuntos de datos WMT’14 ya presentes en el dominio público.
Por otro lado, para hacer que tal sistema alcance los niveles de precisión del Traductor de Google, uno necesitaría acceder a los conjuntos de datos propietarios mucho más grandes de Google, que no se han hecho públicos.
Aún así, ¿qué hay para Google?
- ¿Cuál es la limitación del aprendizaje automático para el comercio financiero?
- ¿La mayor presencia de la tecnología de rastreo finalmente nos despojará de muchas libertades que disfrutamos hoy?
- Cómo hacer que un robot aprenda a caminar
- ¿Cómo se utilizará la IA para la informática del consumidor?
- ¿Qué trabajos actuales estarán a salvo de la automatización y la inteligencia artificial?
Primero, publicar investigaciones y códigos les permite obtener los mejores investigadores e ingenieros para sus equipos. Esto hace una gran diferencia, porque estos problemas están muy abiertos, y solo un puñado de laboratorios académicos en el mundo son realmente competitivos en ellos. Este puñado de laboratorios produce en total una docena o un par de docenas de buenos doctorados de PNL al año. Dicha visibilidad y promesa de impacto se convierte en un factor importante cuando deciden entre ofertas de trabajo. Tenga en cuenta que estas personas no necesitan ir a Google. ¡Otros empleadores potenciales, por ejemplo, aquellos en Wall Street probablemente les pagarán un orden de magnitud más!
En segundo lugar, proporcionar un código de referencia para NMT y otros problemas, atrae a investigadores activos y desarrolladores de software a TensorFlow; lo que con el tiempo dará como resultado mejoras rápidas en TF. TF ya es el marco de referencia de aprendizaje profundo, en gran parte debido al interés académico en él. ¡Tenga en cuenta que CNTK salió con aprendizaje distribuido antes que TF, y fue superior en rendimiento hace dos años! Los académicos líderes aún acuden a TensorFlow precisamente por el efecto comunitario.
Finalmente, Google quiere convertirse en un jugador en el mercado de la nube, donde actualmente está a la zaga de Amazon y Microsoft. TensorFlow tiene el potencial de atraer más negocios empresariales a la plataforma en la nube de Google. ¡Ahí es donde está el gran dinero!
[1] https://arxiv.org/pdf/1705.03122…