¿Cómo utilizan sitios como Airbnb y booking.com el aprendizaje automático?

Esa es una pregunta maravillosa. Trabajé para Booking.com durante 2 años como Data Scientist (personalización, clasificación y precios) y es realmente sorprendente lo profundo que es el agujero del conejo cuando se trata de agencias de viajes en línea y aprendizaje automático.

Cuando un usuario llega a un sitio web no estático, todo el contenido dinámico que recibe es esencialmente una recomendación. Xavier Amatriain ha hecho un mejor trabajo al explicar por qué este es el caso, pero permítame centrarme en el Ranking de OTA específicamente, para agregar algo de valor y responder a su pregunta exacta.

Supongamos que nuestro usuario llega al sitio web y busca un hotel en París. A partir del 20 de noviembre de 2016, Booking.com tiene 4.304 propiedades diferentes. Es prácticamente imposible enumerarlos a todos de manera digerible, por lo que tenemos que elegir qué hoteles mostrar, y ese es un uso obvio del aprendizaje automático.

Todos los hoteles no se crean de la misma manera, por lo que los enfoques básicos de clasificación otorgan una puntuación a cada hotel y usted muestra los hoteles con la puntuación más alta. Este algoritmo utiliza datos como la ubicación del hotel, la clasificación por estrellas, las comodidades y el precio, y devuelve una puntuación de clasificación.

Del mismo modo, nuestros usuarios tampoco son creados de la misma manera. Muchas veces, queremos usar alguna información del usuario. ¿De dónde viene él? ¿Qué tipo de hoteles suele reservar? ¿Va allí de lunes a viernes, indicando negocios o durante un fin de semana indicando ocio?

El problema en este nivel se puede resolver con el aprendizaje automático de libros de texto , que va desde un simple clasificador que estima la probabilidad de que un usuario elija un hotel específico, hasta enfoques sofisticados basados ​​en árboles como LambdaMart.

Cuando aplique estos modelos a la escala de Booking.com, notará que de un conjunto de 4.304 hoteles habrá 10 hoteles extremadamente similares que en realidad devuelven la puntuación más alta. Si su opción más probable es un hotel de 4 estrellas de $ 140 con piscina, habrá 10 de los que reciban la puntuación más alta.

Tal lista de hoteles extremadamente similares no solo es aburrida sino también bastante ineficiente. En este punto, nos apartamos de las soluciones de libros de texto y vamos a lo que yo llamo aprendizaje industrialindustrial “. Necesitamos diversificar nuestra lista para servir a una mayor parte de nuestra base de usuarios e incorporar algunos principios de economía del comportamiento. La clasificación por listas es muy compleja, no solo con respecto al modelado sino incluso a la recopilación de datos. Un subcampo de Machine Learning llamado aprendizaje de refuerzo vendrá al rescate, proporcionando soluciones eficientes para el intercambio de exploración-explotación.

¡Pero esto no es suficiente! A medida que el usuario navega por nuestro sitio web, seguimos adquiriendo información sobre sus preferencias. Quizás pase más tiempo mirando el bar del hotel que la piscina, quizás revise las comodidades y descarte rápidamente los hoteles sin servicio de habitaciones. ¡Debemos tener en cuenta toda esta nueva información y adaptar nuestros resultados dinámicamente! Esto es lo que yo consideraría lo último en aprendizaje automático para OTA al momento de escribir este artículo.

Existen modelos de Machine Learning que tratan esta configuración como un POMDP, donde somos muy conscientes de que la primera lista de resultados que entregamos no solo ayuda al usuario a decidir, sino que también nos damos cuenta de lo que está buscando. Tales marcos, aunque elegantes, son muy pesados ​​computacionalmente, por lo que las aproximaciones requeridas para escalar para servir a millones de usuarios son un campo activo de investigación.

Finalmente, para darle vida, Booking.com y AirBnB no solo tienen usuarios que cuidar, sino también hoteles y anfitriones. Son muy conscientes del hecho de que la forma en que clasifican su inventario afecta al mercado en su conjunto, define su relación a largo plazo con su oferta y demanda y, por lo tanto, con el valor de tiempo de vida de sus clientes y socios. Ahora estamos entrando en el mundo del diseño de mecanismos, y su cruce con el aprendizaje automático bajo el término diseño de mecanismo algorítmico. Que yo sepa, esto sigue siendo un aprendizaje automático utópico y la mayoría de las empresas recurrirán a simples heurísticas e intervenciones para mantener su salud en el mercado, en lugar de tratar de aplicar soluciones de aprendizaje automático.