¿Cómo se comparan las capacidades y trayectorias de aprendizaje automático de Facebook y Google? ¿Por qué esto importa en términos del desempeño futuro de las dos compañías?

Aunque no leería demasiado sobre la reciente victoria de Google sobre Facebook en Go (el juego de mesa, no el lenguaje de programación), creo que está claro que Google es mucho más una potencia de aprendizaje automático que Facebook. Sí, Facebook trajo al pionero del aprendizaje profundo Yann LeCun hace un par de años, lo que fue un golpe de estado. Pero el equipo de investigación de IA que dirige es pequeño: menos de 50 personas.

Incluso si lanzamos una red más amplia, LinkedIn enumera alrededor de 1300 personas que trabajan en Facebook y tienen “aprendizaje automático” en sus perfiles.

Por el contrario, LinkedIn enumera más de 5.600 para Google, incluidos más de 170 que trabajan para su división DeepMind.

Google es una empresa mucho más grande que Facebook, por lo que esos números representan proporciones similares de sus empleados totales. Pero el tamaño importa. Google, ¿o debería decir Alfabeto? – está invirtiendo conscientemente una parte sustancial de sus recursos en perseguir disparos a la luna, mientras que Facebook está mucho más enfocado en los productos que está construyendo aquí y ahora.

Por lo tanto, aunque espero que Facebook continúe haciendo grandes cosas con el aprendizaje automático (presenciar la efectividad de sus noticias), no veo que logren avances de la magnitud, y mucho menos la escala, que veremos en el futuro de Google investigadores

Pero eso no significa que Google supere a Facebook. Para todas las habilidades de aprendizaje automático de Google, han fallado en las redes sociales y a menudo han tropezado con sistemas de recomendación (¿alguien recuerda Google Hotpot?). Las grandes ciencias de la computación y la ingeniería de software no siempre se traducen en excelentes productos, y Facebook a menudo parece mucho mejor que Google cuando se trata de sentido del producto y experiencia del usuario.

Además, Google y Facebook se superponen pero de ninguna manera tienen agendas idénticas. Google puede terminar aplicando su destreza de aprendizaje automático a problemas como el ahorro de energía en los centros de datos, donde compite más con Amazon y Microsoft que con Facebook.

Afortunadamente para el resto de nosotros, Google y Facebook están invirtiendo significativamente en la aplicación y el avance del aprendizaje automático. Todos ganamos, no solo como usuarios de sus productos, sino porque toda la industria tecnológica avanza con ellos.

¡Encienda las antorchas y que fluyan los tensores!

En pocas palabras, diría que Google parece tener el enfoque principal en el aprendizaje automático “general” y la investigación de aprendizaje profundo, y el objetivo secundario es incorporarlo en sus productos. Aunque, Facebook también realiza una gran cantidad de investigación general sobre aprendizaje automático y aprendizaje profundo, parece que el “producto” es su objetivo principal.

Tanto Google como Facebook han abierto recientemente sus herramientas de aprendizaje profundo “principales”. Google parecía estar un paso (o unos pocos meses) por delante con el lanzamiento de TensorFlow. En general, TensorFlow parece ser mucho más general que los módulos Torch de Facebook (FAIR), y esta es también la impresión que tengo del enfoque de Google frente a Facebook para el aprendizaje automático y la investigación de IA.


Un poco de digresión:

En primer lugar, los marcos de software son solo una herramienta para implementar sus algoritmos y crear sus modelos. Por supuesto, las características y capacidades de dicha herramienta, y su relativa eficiencia computacional, juegan un papel importante en el desarrollo de su producto o en la realización de su investigación en general. Sin embargo, tener un marco de software popular en su lugar es solo una pieza del rompecabezas. Finalmente, se reduce a la cantidad y calidad de los datos de “capacitación”.

En mi opinión; La cantidad de datos disponibles (y el aprendizaje incremental) hacen toda la diferencia entre el motor de búsqueda de Google y Bing de Microsoft, por ejemplo.

De todos modos, volvamos a los marcos de software. Aquí, Google estaba un paso por delante de Facebook con su lanzamiento de TensorFlow. El código abierto de su poderoso marco de aprendizaje profundo les atrajo mucha atención y presión positiva. ¿Por qué eso importa? Bueno, ayuda a atraer personas nuevas y talentosas a sus proyectos.

Yo diría que además de crear “productos”, Google tiene un enfoque más fuerte hacia el aprendizaje automático general y la investigación de inteligencia artificial que Facebook: Facebook parece estar más orientado a los productos. Tome la adquisición de DeepMind por parte de Google en 2014, por ejemplo, que se esfuerza por “resolver la inteligencia”. Por supuesto, existe esta aplicación particular de “jugar Go” que recibió mucha prensa en los últimos días, y esto seguramente es bien merecido. Sin embargo, creo que el objetivo de Google DeepMind es un poco más amplio. Aquí, el enfoque no está en desarrollar un sistema especializado que pueda jugar Go muy bien, pero el equipo está tratando de construir un sistema (aprendizaje de refuerzo) que pueda aprender “cualquier cosa” (en algún momento en el futuro).

Algo similar está sucediendo con Google Brain, fundado en 2011; Aquí, diría que el enfoque fue más fuerte en el lado de la infraestructura / tecnología, en comparación con DeepMind. En cualquier caso, estos proyectos no son puramente “proyectos de investigación”, sino que dieron como resultado sistemas útiles que ahora se utilizan en los productos de Google, por ejemplo, reconocimiento de voz, búsqueda de fotos de Google +, recomendaciones en YouTube, autos sin conductor, etc.

Por otro lado, Facebook comparte intereses muy similares en este tipo de investigación: estoy hablando de 2013, cuando Facebook intentó sin éxito adquirir DeepMind.

Anteriormente, dije que no solo los algoritmos, las herramientas y la infraestructura son importantes, sino también los datos disponibles. Aquí, creo que Google tiene una ventaja significativa sobre Facebook cuando se trata de la amplitud de diferentes “tipos de datos”. Claro, Facebook tiene acceso a muchas imágenes y texto, tal vez videos. Pero todo esto está en el contexto de las redes sociales. Sin embargo, con Google+, es un motor de búsqueda, YouTube, Android, etc. Google tiene más plataformas que se pueden utilizar para recopilar datos para la investigación.

En resumen, en términos de desarrollo de productos, diría que Facebook está más enfocado en resolver problemas relacionados con motores de recomendación, análisis de texto e imágenes, mientras que Google agrega reconocimiento de voz y al grupo y también tiene un fuerte (er) enfoque en el refuerzo aprendizaje (juegos Atari de DeepMind, Go *, autos sin conductor)

En los próximos 10 años, el aprendizaje automático será el elemento más importante no solo de Google y Facebook, sino de casi todas las empresas tecnológicas y no tecnológicas. El poder que libera esta tecnología cambiará la estructura de cada negocio de una manera más significativa que la computadora misma hasta este punto.

Máquina de enseñanza de la máquina

Fue el pionero de la IA Arthur Lee Samuel en 1959 quien definió lo que hoy se conoce como Aprendizaje automático hoy en día: “Un campo de estudio que brinda a las computadoras la capacidad de aprender sin ser programado explícitamente” [1]. Machine Learning es un subconjunto de Inteligencia Artificial, un término de categoría amplia. La base del aprendizaje automático es utilizar los datos necesarios para que una máquina aprenda y se adapte cuando se expone a nuevos datos, una máquina de autoaprendizaje / aprendizaje.

Un sistema fundamental de Machine Learning puede funcionar con datos extraídos y, por lo tanto, crea un nuevo algoritmo y luego actualiza los algoritmos actuales en consecuencia para “aprender” una nueva tarea que se derivó al funcionar en los conjuntos de datos.

Existen diferencias notables entre Machine Intelligence vs. Machine Learning vs. Deep Learning vs. Inteligencia artificial vs. Neural Networks vs. X, sin embargo, para esta presentación generalizaremos sobre Machine Learning y asumiremos que todo lo demás está conectado.


El progreso de la IA y el aprendizaje automático ha sido constante pero lento en los últimos cincuenta años. El ritmo en los últimos cinco años ha sido más rápido que la totalidad de los últimos cincuenta años combinados. Hay muchas razones convergentes para esta aceleración, incluida la Ley de Moore [2] y la gran cantidad de datos que las empresas tecnológicas han cumplido, especialmente en los últimos 10 años. Para funcionar sobre estos datos de una manera racional, sacar conclusiones y actuar sobre estas conclusiones, la tarea ha crecido incluso en las empresas más grandes. En pocas palabras, incluso equipos muy grandes de ingenieros y científicos de datos que trabajan con las mejores herramientas de bases de datos no pueden funcionar completa y eficientemente en el flujo de datos sin alguna forma de Machine Learning en la actualidad.

Google siempre ha utilizado alguna forma de Machine Learning, incluso en sus primeros años comenzaron a implementar sistemas tempranos. Facebook también comenzó a usar Machine Learning en los primeros años. Ambas compañías han hecho grandes compromisos financieros para avanzar las herramientas disponibles interna y externamente. Ambas compañías han lanzado herramientas y marcos de fuente abierta para el desarrollo de semillas, estimular la innovación y tal vez encontrar empresas creativas y el talento que tienen.

Hay bastantes sistemas de aprendizaje automático disponibles hoy en día, incluidos Torch, Caffe y Theano. Tanto Google como Facebook usan o han usado estas herramientas / sistemas de forma independiente y combinados con sistemas desarrollados internamente.

Toda la comunidad de IA ha sido ampliamente una comunidad abierta y académica. Ha habido un espíritu de intercambio y apoyo mutuo. Es algo difícil tener límites claros sobre qué compañía podría, incluso si quisiera, afirmar ser la única fuente de innovación. Ha sido un esfuerzo grupal masivo.

Las comparaciones entre Google y Facebook en esta presentación no son realmente una situación de ganador o no. Ambas compañías son grandes contribuyentes a las comunidades de código abierto y abordan los mismos desafíos programáticos de diferentes maneras y, por lo tanto, las herramientas que desarrollan y usan difieren en el grado de cómo se usan y quizás por qué se desarrollaron en primer lugar.

Google TensorFlow

El trabajo inicial de Google Machine Learning comenzó con DistBelief [3], este fue un desarrollo del proyecto Google Brain [4] iniciado en 2011 como una colaboración de Deep Learning con la Universidad de Stanford. Se hicieron grandes avances con este proyecto académicamente apoyado. Durante más de cuatro años, Google realizó bastantes avances y el proyecto se convirtió en TensorFlow [5]. El 9 de noviembre de 2015, Google lanzó TensorFlow.

Hoy, TensorFlow es utilizado por cincuenta equipos de productos en Google, incluidos los vehículos de reconocimiento de voz, Gmail, Google Photos, búsqueda y conducción autónoma. Desde la apertura del producto, cientos de empresas lo han adoptado. El poder de las herramientas de TensorFlow es que se centra en una plataforma colaborativa que permite un desarrollo interactivo y rápido.

Al igual que Android, con TensorGlow Google está sembrando el mundo del desarrollo con herramientas muy ricas y poderosas que cuestan millones para probar, diseñar, desarrollar y construir. Según muchos estándares, TensorFlow es quizás una de las herramientas de Machine Learning más avanzadas y modernas disponibles en la actualidad.

Facebook AI Research (FAIR)

Facebook ha sido un gran defensor del aprendizaje automático y muy temprano en su historia se basó en gran medida en Torch [6], una biblioteca / framework / lenguaje de scripts de código abierto para aprendizaje automático. Facebook ha contribuido bastante a los repositorios de Torch a lo largo de los años. Facebook AI se encuentra bajo el paraguas de la investigación de Facebook, un grupo que abarca el Aprendizaje automático aplicado a través de la Investigación de la experiencia del usuario.

El equipo FAIR ha estado activo en Facebook durante aproximadamente 5 años y ha trabajado para integrar Machine Learning en todos los aspectos de Facebook. Desde el análisis de oportunidades publicitarias hasta el etiquetado de personas mediante el reconocimiento fiscal, Facebook ha estado utilizando estas herramientas con éxito durante bastante tiempo.

El 17 de enero de 2015, Facebook anunció que lanzaría todos sus módulos optimizados para Torch al dominio público. Facebook ha invertido una considerable cantidad de tiempo creando, modificando y ampliando muchos aspectos de Torch. Se puede decir que Facebook casi rehizo Torch en mayor grado. Facebook también abrió una especificación de hardware de computadora llamada Big Sur. Big Sur se basa en la GPU Nvidia Tesla M40 y puede admitir hasta ocho tarjetas Nvidia Tesla M40. Cada tarjeta Nvidia Telsa M40 tiene 3072 núcleos y 12 GB de memoria. Estas se conocen como tarjetas GPU (Unidad de procesamiento gráfico) y están diseñadas principalmente para representar gráficos de juegos de alta resolución. Sin embargo, también sirven como una especie de supercomputadora de los pobres. Estos GPUS son muy potentes y efectivos en aplicaciones de problemas de procesamiento paralelo como el aprendizaje automático.

Hardware de Big Sur Machine Learning de Facebook.


La trayectoria de código abierto levanta todos los barcos en el puerto

Facebook y Google y casi cualquier empresa, como mencioné anteriormente, necesitarán adoptar Machine Learning en algún momento en los próximos 10 años. La adopción de Machine Learning será una característica definitoria de una empresa exitosa. Al igual que en el pasado, cuando las empresas comenzaron a adoptar computadoras y reemplazar los procesos manuales.

Tanto Facebook como Google están en una trayectoria similar y ambas compañías han adoptado y extendido a toda la comunidad de Machine Learning al sembrar herramientas de código abierto muy potentes. Este ethos fomenta un ecosistema rico y diverso. No hay absolutamente ninguna duda de que ambas compañías están en un curso competitivo, pero se encuentran en un terreno común al apoyar mutuamente a toda la comunidad de IA en el proceso.


[1] Arthur Samuel

[2] Ley de Moore

[3] TensorFlow

[4] Google Brain

[5] http://www.tensorflow.org

[6] Antorcha (aprendizaje automático)

Reformulemos la pregunta con más honestidad: “Google vs. Facebook: ¡Lucha de aprendizaje automático!” A pesar de que esta es una pregunta tonta, y aunque sé poco sobre el estado actual de las capacidades de aprendizaje automático de cualquiera de las compañías, ¡todavía creo que puedo dar una respuesta correcta! Métodos similares estarán disponibles para ambas compañías en el futuro, por lo que los dos factores más importantes que determinarán el ganador de esta batalla de ML inexistente, ni siquiera posible, de Quora-cebo son (1) qué compañía necesita más aprendizaje automático; y (2) ¿Quién tiene mejores datos?

Para mí es bastante claro que Google necesita más aprendizaje automático. Tanto la búsqueda como los anuncios de búsqueda dependen en gran medida del aprendizaje automático de un tipo u otro, por lo que el negocio principal de Google realmente requiere capacidades sólidas de aprendizaje automático. En el caso de Facebook, la predicción de clics es claramente importante para la publicación de anuncios, pero el aprendizaje automático parece menos crítico para el suministro de noticias, que es el núcleo de su producto. El éxito de Instagram muestra que los usuarios pueden estar contentos con los enfoques de laissez-faire para la clasificación de feeds.

La cuestión de quién tiene mejores datos es más interesante, en parte porque dos tipos de datos son muy opuestos. Facebook sabe mucho de nosotros como individuos, especialmente qué y a quién (pretendemos) gustar. Pero aparte de nuestro comportamiento en su sitio, Facebook sabe principalmente lo que estamos dispuestos a compartir con el mundo, lo cual es necesariamente superficial. A pesar de los esfuerzos en otras direcciones, Google nos conoce principalmente a través de nuestras consultas anónimas. Pero debido al anonimato (o anonimato percibido) de nuestras interacciones con Google, estamos dispuestos a compartir nuestras verdaderas curiosidades y deseos, y con muchos más detalles que “me gusta”. Es difícil imaginar una fuente de datos más rica para el aprendizaje automático que la “base de datos de intenciones” de John Battelle. Google también gana en ese puntaje.

Ganador: Google .

No sigo de cerca a estas dos empresas cuando se trata del aprendizaje automático, pero siento la importancia de describir algunos componentes bastante distantes del “aprendizaje automático” dentro de las grandes empresas:

  1. Grandes victorias, como Go.
  2. Logros académicos y semi-académicos relacionados y no relacionados.
  3. Código abierto para fines académicos, como el solucionador Ceres.
  4. Código abierto para fines de infraestructura, como Presto.
  5. Soluciones de aprendizaje automático patentadas que se utilizan día a día (búsqueda, anuncios, clasificación de feed personalizada).
  6. El aprendizaje automático patentado avanza (autos autónomos, Jarvis).
  7. Departamentos internos relacionados con el LD y qué tan bien se integra con el resto de la organización (ej. MSR).

Por lo tanto, cuando se trata de capacidades y rendimiento futuro, realmente no es una comparación unidimensional.

En una infraestructura en tiempo real a gran escala con tecnología ML, creo que Google está por delante de Facebook. También parece estar a la vanguardia en la investigación “elegante” y “académica”.

En aplicaciones prácticas, como Jarvis o M, mi favorito personal es Facebook. Pero no tiene mucho que ver con el talento, sino más con la posición inicial: al igual que Uber está en una posición mucho mejor para lanzar una flota de taxis sin conductor que Google, Facebook está en una posición mucho mejor para lanzar un chat inteligente asistente utilizado por cerca de mil millones de personas.

En general, el enfoque de Google es más fundamental, pero Facebook está demostrando fuertes habilidades para reducir y abordar con éxito problemas específicos con visiones comerciales destiladas.

En una nota de cierre, tengo una creencia algo controvertida de que una compañía de $ 100B + AI, que en diez años sería tan grande como lo es Google hoy, ni siquiera existe.

Las dos compañías son muy diferentes.

El principal producto de Google, la búsqueda, es un producto de aprendizaje automático. Por lo tanto, están mucho más invertidos en el aprendizaje automático, en gran parte bajo el pretexto de la ingeniería.

El principal producto de Facebook, por otro lado, es la información construida a partir de su red social. Por lo tanto, reduce sus esfuerzos de aprendizaje automático en torno a herramientas que dan servicio a esta red social. Es una empresa mucho más pequeña, y esto se refleja en la cantidad de empleados que trabajan o trabajan con el aprendizaje automático.

Ambas compañías han invertido recientemente en la investigación y el desarrollo de redes neuronales (ahora conocido como aprendizaje profundo) después de la revolución de las GPU. Las principales actividades de Google a este respecto parecen evolucionar en torno a DeepMind en Londres, liderado por David Silver y Demis Hassabis, mientras que Geoff Hinton trabaja en Mountainview en partes del año. Los esfuerzos de Facebook están dirigidos por Yann LeCun en Nueva York, mientras que también tienen investigadores activos en París y su sede en Menlo Park.

Parece que los CEO de Alphabet y Facebook tienen un gran interés en estos desarrollos, y el nivel de compromiso muestra que está más allá del alcance de los proyectos favoritos de una empresa de Silicon Valley rica en efectivo. La influencia en el desempeño futuro de las dos compañías depende naturalmente del resultado de tales proyectos de investigación en los próximos años.

Si bien uno necesita un oráculo para predecir el resultado de los proyectos de investigación, aún podemos hacer algunas predicciones dentro de lo razonable sobre los sabores de los productos que producirán. La creencia convencional es que Google tiene los recursos para dirigir más desarrollo en la infraestructura para su investigación y productos de aprendizaje automático, mientras que Facebook puede poner más madera detrás de sus menos flechas.