¿Cuáles son algunos de los problemas de investigación más interesantes en los sistemas de recomendación?

La investigación de recomendaciones recibió un impulso con el desafío de Netflix, lo que significa que hay muchos documentos de calidad sobre cómo predecir una calificación de 1-5 para los elementos de un conjunto de datos de calificaciones anteriores. Ese es un campo que parece estar saturado, pero hay muchos problemas abiertos:

Recomendación entre dominios: los sistemas actuales son realmente buenos para aprender las preferencias en un dominio (por ejemplo, películas), pero los mismos algoritmos no funcionan tan bien en otros dominios (New Generation Computing, Volumen 26, Número 3). Por ejemplo, si te gusta el rock y el pop en la música, ¿qué dice sobre tus gustos cinematográficos? Realmente me gustaría ver un modelo unificado de preferencia para un individuo, que explica cómo interactúan los diferentes dominios e informan nuestras preferencias.

Recomendación basada en restricciones: la mayor parte de la investigación se ha centrado en productos virtuales como películas y música, donde se puede recomendar un artículo un número ilimitado de veces. En el mundo real, ese no suele ser el caso. Considera restaurantes. Si se recomienda un gran restaurante a más personas de las que puede manejar, se esfuerza por hacer frente a la carga y su servicio disminuye (el problema de evitar las multitudes ). ¿Cómo se recomienda en dominios donde los artículos son limitados? Aquí la recomendación se convierte en una versión relajada del clásico problema de correspondencia.

Recomendación del grupo: aquí, La premisa básica es recomendar un artículo a un grupo de personas, por ejemplo, ir juntos al cine. Este problema ha sido explorado por algún tiempo, pero todavía estamos sobresaliendo en solo una parte del problema (http://dl.acm.org/citation.cfm?i…). Los modelos típicos calculan recomendaciones individuales y luego usan una forma inteligente de combinarlas. Pero a menudo habrá desacuerdos, y diferentes grupos pueden tener diferentes dinámicas. Existe una vasta literatura sobre estrategias y mecanismos de consenso y votación que podrían explorarse, así como paradigmas de interacción de usuario de múltiples etapas.

Impacto de las recomendaciones: las recomendaciones tienen un efecto en las tendencias de calificación de las personas (¿está viendo creer?), Pero hasta la fecha ha habido poca investigación para comprender cómo las recomendaciones pueden afectar nuestras preferencias. Por ejemplo, si me dicen que el 99% de las personas como yo compran este artículo, ¿estaré más dispuesto a comprarlo? ¿Qué efectos puede tener en la distribución a largo plazo de las ventas en el inventario y cómo puede controlarlo? Esto se vuelve más interesante cuando piensas en un grupo de individuos en una comunidad. Un algoritmo de recomendación particular puede no solo restringir el acceso de las personas a la información, sino que también puede influir en sus opiniones o incluso en la estructura de la comunidad (los efectos de la red al recomendar conexiones sociales). Sería genial si pudiera haber modelos de toda la comunidad para comprender y controlar estos efectos, en lugar de solo modelos basados ​​en elementos o basados ​​en el usuario.

Recomendación y redes sociales: La recomendación social” parece haberse popularizado en gran medida. Muchas compañías usan funciones sociales en sus recomendaciones basadas en las preferencias de sus amigos y otras características de la red. Por ejemplo, a X y 20 personas más les gusta este artículo. Sin embargo, se entiende poco acerca de cómo las fuerzas sociales subyacentes a una red social interactúan e influyen en las preferencias de las personas, tanto hacia un elemento como hacia sus amigos. Los psicólogos sociales tienen una vasta literatura que describe teorías como la homofilia, la influencia social, la identidad, la prueba social, la conformidad, etc., pero no está claro cómo se desarrollan en las redes sociales en línea. Además, las propias redes sociales actúan como vehículos de información, difundiendo ideas e información a través de la red. Esto significa que las preferencias del usuario en una red no solo son dinámicas, sino que tienen una interdependencia con la red (Patrones de influencia en una red de recomendaciones, Recomendación centrada en la red: Personalización con y en las redes sociales). ¿Cómo diseñas modelos de recomendación en contextos sociales?

Recomendación basada en el contexto: con el uso creciente de dispositivos móviles, el usuario divulga una gran cantidad de información contextual, por ejemplo, ubicación, actividad actual, etc. Estas fuentes de datos brindan información en tiempo real, que son tanto una oportunidad como un desafío para un sistema de recomendación. ¿Cómo incorporas esa información tan detallada en los modelos de recomendación?
Este es un campo muy activo, hay un taller en la conferencia anual de Sistemas de recomendación dedicado a desarrollar formas inteligentes de interpretar datos contextuales (Taller CARS, verifique también años anteriores).

Recomendación y privacidad: Tener acceso a grandes cantidades de datos sobre los usuarios plantea grandes preguntas de privacidad. La privacidad en la recomendación es una preocupación importante, y sería genial ver algún trabajo teórico y empírico. En el lado de la teoría, la necesidad es de modelos que puedan dar garantías de privacidad (como la privacidad diferencial) para cierto diseño de sistemas de recomendación (sistemas de recomendación diferencialmente privados). Desde el punto de vista empírico, es importante comprender la compensación entre las preocupaciones de usabilidad y privacidad de las recomendaciones, y cómo diseñar para obtener resultados más consistentes con la privacidad (Personalización y privacidad).

Recomendación como enrutamiento inteligente de tareas: este es un campo bastante nuevo (al menos en CS) que habla sobre el crecimiento de las comunidades en línea. Un buen ejemplo es Wikipedia, que actualmente está intentando atraer nuevos editores. Si piensa en cada artículo como una tarea, entonces la tarea de recomendación es sugerir nuevos artículos a los usuarios para que los intereses individuales estén bien atendidos y haya una productividad favorable en Wikipedia (http://dl.acm.org/citation .cfm? i …). En términos más generales, el objetivo es comprender el crecimiento y la evolución de las organizaciones humanas, y cómo pueden ayudar las recomendaciones (de personas o tareas). O pensando en la comunidad de revisiones en línea y cómo la recomendación de revisiones similares anteriores puede ayudarlo a escribir una revisión mejor y más útil. Esto también puede ser una construcción útil para la recomendación en la empresa (http://dl.acm.org/citation.cfm?d…).

Nuevos dominios para recomendación: si le interesan los nuevos dominios, entonces hay mucho trabajo interesante por hacer en dominios en los que las recomendaciones podrían ser útiles, pero la comunidad no ha prestado mucha atención. Por ejemplo, discusiones y comentarios en un foro como reddit, recomendaciones de expertos en dominios como LinkedIn, recomendaciones de videos que usan más que funciones de texto / etiquetas, etc.

Como siempre, la mejor manera de buscar problemas que le interesen es leer algunas encuestas. Aquí hay algunos buenos: [1006.5278] Una encuesta sobre sistemas de recomendación, [1202.1112] Sistemas de recomendación, Hacia la próxima generación de sistemas de recomendación, Sistemas de recomendación híbridos.

Espero que esto ayude. Hay muchas preguntas, es un gran campo para estar en este momento, especialmente a medida que Internet y los dispositivos móviles impregnan cada vez más nuestras vidas y cada vez hay más información disponible para el cálculo.

También significa que los sistemas de recomendación enfrentan una responsabilidad como nunca antes. El límite entre las acciones fuera de línea y en línea se está volviendo cada vez más delgado, por lo que debemos tener en cuenta el impacto que pueden tener los modelos de recomendación.

Un área de motores de recomendación que todavía es relativamente incipiente es el uso de la computación humana como recurso en el sistema. Las máquinas son mejores en algunas tareas (por ejemplo, realizar rápidamente cálculos complejos en grandes cantidades de datos estructurados); los humanos son mejores para los demás (por ejemplo, interpretar el significado en imágenes y lenguaje). Hay una cierta clase de problema que requiere precisamente la combinación de estas capacidades.

Un ejemplo de esto es Stitch Fix, un servicio de compras personales en línea de ropa (divulgación: trabajo allí). El servicio no sería efectivo ni con humanos ni con máquinas. Las contribuciones de los diversos recursos son complementarias y aditivas (posiblemente sinérgicas). Las máquinas proporcionan cálculos rápidos sobre datos estructurados que sirven para clasificar y calificar las recomendaciones. Esto permite que las recomendaciones se reduzcan a fragmentos manejables y ordenados. A su vez, esto permite a los expertos humanos procesar aún más los resultados, aprovechando datos adicionales a los que solo ellos pueden acceder. Por ejemplo, los datos no estructurados, como el texto sin procesar y las imágenes, generalmente requieren que los humanos extraigan el significado, pero mejoran materialmente las recomendaciones. Los humanos también pueden contribuir con su propio conocimiento de propiedad, como las tendencias que han observado pero que aún no se manifiestan en los datos.

Puede encontrar más información sobre Stitch Fix en una breve charla aquí:

La computación humana es un campo emergente. Hay una gran conferencia esta semana: HCOMP 2013

Añadiría los siguientes dos temas a la respuesta de Amit:

El problema del arranque en frío , es decir, cómo iniciar un sistema de recomendaciones y proporcionar recomendaciones cuando no hay mucha información de usuario disponible

La “cola larga” , es decir, cómo recomendar elementos menos conocidos / desconocidos y evitar el sesgo de recomendar solo contenido popular (y así sucesivamente …)

Estos son problemas antiguos y bien conocidos, pero siguen siendo áreas de investigación activas.

Moda.

Hay millones de productos, tienen una vida media de meses o semanas, no hay ganadores directos (por ejemplo, películas o teléfonos inteligentes donde 2 dispositivos ocupan el 60% del mercado), y la categorización es muy desordenada (es un tacón, un cuña, una sandalia o un zapato). La decisión de compra involucra el estado de ánimo (qué es lo que quiero en este momento), el gusto (lo que generalmente me gusta) y la calidad (qué puedo pagar / estoy contento), cada uno con docenas de dimensiones significativas.

Los productos, pero también los clientes, se mueven con el tiempo en ese espacio de alta dimensión y debes tenerlo en cuenta (probablemente no estés usando el mismo estilo que usabas hace 5 o 10 años; si vendes a adolescentes, ese cambio se mide en meses).

Debido a la baja frecuencia de compras por cliente, la variabilidad entre los clientes y la cantidad de cosas que pueden suceder antes de una compra, también es muy difícil medir el éxito del sistema de recomendación de manera objetiva (frente a, por ejemplo, películas, que cuestan más o menos lo mismo).

El sistema recomendado se usa para la evaluación de la base de contenido y estamos viendo en la vista de solo los sistemas de recomendación de la base de elementos, pero si se desarrolla cualquier sistema recomendado de servicio médico o podemos cambiar la vista del sistema recomendado para las bases de nivel de ayuda de la sociedad. ¿Pensamos en los sectores de servicios de medicina de cuentos y estilo de vida humano? Es posible….

More Interesting

¿Cuáles son las últimas ideas de investigación en informática?

¿Por qué el PageRank es muy alto para los nodos en un gráfico con indegree cero?

¿Cuáles son algunos de los mejores libros sobre economía computacional?

¿Qué profesores de informática han tenido un impacto significativo en la industria? Por impacto, me refiero a cualquier otra cosa que no sea el escenario en el que un profesor publica artículos, y esos artículos nunca son leídos por personas de la industria o impactan prácticas industriales.

¿Qué son la minería de datos, la ciencia de datos, la inteligencia / análisis de negocios y la investigación operativa?

Ciencias de la Computación: ¿Cuán competitivo es el premio al mejor trabajo estudiantil en SODA?

¿Cuál es la mejor oportunidad de carrera para el ingeniero de investigación de visión por computadora (pregrado) en India?

Gráficos por computadora: ¿cómo funciona Matchmoving?

¿Cuáles son los mayores problemas con la seguridad informática en los laboratorios?

¿Existe una relación entre el aprendizaje múltiple y el análisis de datos topológicos?

¿Ha habido nuevos algoritmos brillantes de informática en los últimos 10 años?

¿Cuáles son las conferencias de alto nivel o los expertos en informática afectiva?

¿Cuáles son las diferentes áreas en las que un estudiante de informática de segundo año puede realizar su pasantía de verano?

Cómo saber cuáles son las últimas áreas de investigación en informática

¿Qué piensan los investigadores de IA, ML y NLP del Watson de IBM? ¿Tiene el potencial de tener un gran impacto?