¿Cuál es la motivación de Google para el código abierto del modelo de TensorFlow para problemas ML / NLP como el resumen automático de texto?

Además de lo que Dave Orr ha mencionado sobre el avance del estado del arte; Google es un negocio, por lo que sus acciones deben tener sentido estratégico. Algunos ejemplos de cuán importante es el factor comercial en la toma de decisiones de Google son evidentes en cómo en el último mes reemplazaron el liderazgo del proyecto de automóviles autónomos con la esperanza de hacerlo un negocio más viable y también reducir su personal en Google Fiber.

Para ver las cosas desde una perspectiva estratégica, una decisión debe pensar en el ROI: ¿cuál es el beneficio frente al costo / riesgo para sus negocios actuales y futuros?

En este momento, el aprendizaje automático, el lenguaje natural y el talento para el aprendizaje profundo son raros y muy deseables, especialmente para Google que quiere “organizar la información del mundo”. Por lo tanto, un beneficio para el abastecimiento abierto de esta tecnología es que Google puede obtener una gran cantidad de talentos valiosos que contribuyen a su tecnología y también aumentan su diseño para unirse a Google. Tener el mejor talento de PNL y aprendizaje profundo es increíblemente valioso en este momento. También creo que los juegos de herramientas tienen efectos de red: cuanto más personas usen un juego de herramientas en particular, más escribirán sobre él y compartirán en la web, lo que facilitará el uso de otros.

El segundo beneficio es que Google está tratando de crear otro negocio lucrativo más allá de la búsqueda y necesitan una propuesta de valor diferenciada para una de sus apuestas clave: Google Cloud. Estoy seguro de que Google espera que el aprendizaje profundo con TensorFlow pueda ser una de esas características asesinas.

En términos de riesgos, el código abierto puede ser una mala idea si alguien puede usar su tecnología en su contra. Sin embargo, como Borislav Agapiev mencionó, Google tiene algunas barreras importantes para ingresar a sus productos, como su recopilación de datos de uso de búsqueda que protegen búsqueda, datos de uso de correo electrónico que protegen gmail, datos de uso móvil que protegen Android, etc., y como sabemos, los datos son cruciales para aprendizaje. Por lo tanto, incluso si una empresa tuviera exactamente la misma tecnología de plataforma que Google, los negocios actuales de Gogole tienen grandes reservas en sus activos de datos que los protegen.

En resumen: los modelos de fuente abierta TensorFlow y PNL empujan los límites en un espacio difícil, inspira a las mejores personas a unirse o contribuir a su misión, y crea una propuesta de valor potencialmente diferenciada para su negocio en la nube emergente con poco inconveniente o riesgo debido a Los fosos de Google en los datos.

Estas son ideas similares a por qué nosotros (Microsoft) abrimos nuestro CNTK de herramientas de aprendizaje profundo hace un par de años.