¿Cuál es el algoritmo detrás de la agregación de noticias de Facebook News alrededor de una palabra clave en particular?

Yo era el ingeniero principal en este proyecto, así que intentaré esto. Sin entrar en demasiada salsa secreta …

1) Creamos modelos de lenguaje basados en corpus disponibles públicamente para la extracción de nuestra entidad. En base a estos datos, podemos extraer temas en varios niveles de confianza. Para responder a su pregunta, sí, puede encontrar términos como “desarrollo detenido” a partir del texto normal. También puede desambiguar entre palabras como “Apple”, la fruta, y “Apple”, la compañía de computadoras.

2) Tenemos un segundo nivel de infraestructura que intenta utilizar otros datos para aumentar la precisión. En general, puede pensar en esto agregando más contexto a la ecuación, mientras que el primer nivel solo tiene en cuenta el texto de un mensaje.

3) Tenemos algunas heurísticas para decidir mostrar un grupo particular. En general, esta es una combinación de tratar de filtrar el ruido del sistema de extracción y decidir cuándo algo es lo suficientemente interesante como para mostrarlo. Dos de tus amigos hablando de plátanos, por ejemplo, es bastante poco interesante.

¿Puedes dar ejemplos de cómo usamos las estructuras de datos en el mundo real?

¿Cuál es la mejor fuente disponible para aprender estructuras de datos y algoritmos para un principiante?

Dado un gráfico ponderado de N nodos, ¿existe un algoritmo que calcule la ruta más corta entre todos los nodos?

¿Cuáles son las consideraciones más importantes para convertir un algoritmo en codificación?

Cómo detectar imágenes en un documento de Word escaneado

¿Cómo se implementa el algoritmo HITS?

Facebook dice que el usuario promedio tiene acceso a alrededor de 1,500 publicaciones por día, pero solo mira 300. (Un usuario que se desplaza sin cesar eventualmente verá todas las publicaciones de sus amigos y un puñado de publicaciones de las páginas que siguen).

Para asegurarse de que esas 300 publicaciones sean más interesantes que todas las demás, Facebook dice que utiliza miles de factores para determinar qué aparece en el feed de cualquier usuario individual. Las mayores influencias son bastante obvias. Lo cerca que estás de una persona es una métrica cada vez más importante, a juzgar por la frecuencia con la que te gustan sus publicaciones, escribes en su línea de tiempo, haces clic en sus fotos o hablas con ellos en Messenger, el servicio de chat de Facebook. El tipo de publicación también es un factor importante, ya que Facebook espera mostrar más enlaces a las personas que hacen clic en muchos enlaces, más videos a las personas que miran muchos videos, etc. El algoritmo también supone que el contenido que ha atraído mucho compromiso tiene un gran atractivo y lo colocará en los feeds de más personas.

Pero hay otros factores menos intuitivos para el algoritmo. Use un teléfono con una conexión móvil lenta y es posible que vea menos video. Escribir “felicitaciones” en un comentario indica que la publicación probablemente sea sobre un gran evento de la vida, por lo que recibirá un impulso. Me gusta un artículo después de hacer clic en él es una señal positiva más fuerte que antes, ya que significa que probablemente leyó la pieza y la disfrutó.

Según la compañía, el cálculo exacto que determina cómo se unen todos estos factores está en constante flujo. Los ingenieros también ejecutan continuamente múltiples experimentos con aproximadamente el 1% de los usuarios de Facebook en un intento por aumentar el compromiso. Durante una semana a mediados de mayo, por ejemplo, una prueba daba mayor preferencia a las fotos etiquetadas que incluían amigos cercanos, mientras que otra aumentaba la clasificación de las historias que la gente pasaba más tiempo mirando en el iPhone. Los experimentos que los gerentes de productos de News Feed consideran exitosos se implementan rápidamente a nivel mundial para todos los usuarios. Se observan grandes actualizaciones en un blog de News Feed, pero se producen cambios más pequeños sin fanfarria. Dos o tres cambios generalmente ocurren cada semana.

El nuevo equipo de evaluadores humanos, que Facebook llama el “panel de calidad de alimentación”, es clave para mostrar este contenido significativo. Cada día, un panelista típico califica 60 historias que en realidad aparecerían en sus propias fuentes de noticias en una escala de 1 a 5, juzgando lo interesantes que encontraron las publicaciones. También reordenan sus propios feeds para mostrar cómo sus prioridades difieren de las del algoritmo, proporcionando lo que Facebook llama un puntaje de transposición. Y escriben explicaciones de un párrafo de por qué les gusta o no les gusta ciertas publicaciones, que a menudo se revisan en las reuniones semanales de ingenieros de News Feed. Facebook también realiza periódicamente encuestas en línea sobre la satisfacción de News Feed y trae a los usuarios promedio de la calle para que demuestren nuevas funciones en sus laboratorios de usabilidad.

Algunos de los cambios provocados por estos métodos ya le han llegado en Facebook, como un ajuste de abril que otorgó mayor prioridad a las publicaciones de amigos cercanos y un cambio de junio que agregó tiempo dedicado a leer una publicación como factor de algoritmo. La compañía ve este tipo de mejoras, que no necesariamente se pueden medir a través de métricas básicas de participación, como cruciales. ¡Facebook dice que el panel de calidad de alimentación es actualmente representativo de su base de usuarios en los Estados Unidos, pero la compañía tiene planes de expandir la iniciativa a nivel mundial!

Ashutosh Tripathi

Hola a todos, me gustaría compartir este blog con ustedes. CÓMO FUNCIONA EL ALGORITMO DE FACEBOOK – Digital Marketing Jobs

Por favor déjame saber lo que piensa.

Prasad

Keith Adams

More Interesting

Como principiante, ¿debería leer el libro CLRS antes de comenzar con Interviewbit?

¿Podemos decir que el Aprendizaje automático es nuestro compromiso para los problemas para los que no pudimos encontrar algoritmos? Argumentos

¿Existen algoritmos en R que permitan clasificar una variable binaria basada en un conjunto de cadenas (texto)?

¿Cuáles son algunos ejemplos del mundo real de máquinas simples?

¿Cómo funciona el algoritmo DeepMind?

¿Cómo funciona el algoritmo de Amazon?