¿Cuáles son las lecciones del desafío del Premio Netflix?

Adriano, Nikola y Simon señalan la importancia de los métodos de combinación de conjuntos o sistemas. Sin duda, la combinación de sistemas es casi siempre una victoria. Participé en el taller Reliable Information Access que se llevó a cabo en MITRE en 2003. Al final de las seis semanas en las que se usaban ocho o más sistemas de recuperación de información constantemente, alguien dijo: “hagamos un sistema de conjunto por votación mayoritaria”. . Superó a todos los sistemas en rendimiento, no por mucho, pero fue el mejor. El resultado fue recibido con un aire de “ninguna sorpresa aquí”.

Las computadoras de consumo con dos o más CPU, posiblemente un chip GPU multinúcleo adicional, ahora son comunes. ¿Por qué no usamos métodos de conjunto todo el tiempo? No lo sé. Puede ser un remanente el hecho de que muchos de los algoritmos que ahora son fáciles de ejecutar eran intensivos en CPU (el reconocimiento de voz viene a la mente), por lo que tuvo que implementar un único y mejor algoritmo. O tal vez la programación paralela es demasiado difícil, etc. Pero este ya no es el caso.

Por lo tanto, agregaría que si bien el Premio es otro ejemplo que muestra que la combinación de sistemas es casi siempre una victoria, esta lección ha tenido sorprendentemente poca influencia en cómo llevamos a cabo las tareas de aprendizaje automático. Como muestra mi anécdota MITRE, las ventajas de la combinación de sistemas son de conocimiento común en la comunidad de reconocimiento de patrones ML. Sin embargo, ¿cuándo fue la última vez que leyó sobre investigaciones que identificaron un buen conjunto de reconocedores independientes para algunas, por ejemplo, tareas de visión por computadora? Tal conjunto tendría un rendimiento probablemente correcto que le permitiría optimizar su función de costos para el reconocimiento.

Otro ejemplo que muestra cuán poco pensamiento de conjunto impregna la investigación de ML es la abundancia de nuevos algoritmos que se publican cada año. Un artículo típico que describe un nuevo algoritmo tiene una comparación de su métrica de desempeño con otros algoritmos y se declara ganador en algunas o todas sus condiciones de prueba. No recuerdo haber leído un artículo que midiera cuán independiente era de los sistemas que venció. Sin embargo, la independencia es una característica crucial si desea tener el mejor sistema de conjunto posible.

Tampoco he visto ningún artículo que anunciara como el único mérito de su algoritmo que fuera el más independiente, algo que sería de gran interés teórico / práctico, ya que aumentaría de inmediato el rendimiento del estado del arte en una tarea en particular.

Veo señales de que el Premio y la aparición de las redes sociales y los mercados de crowdsourcing están cambiando todo esto. Esperemos que sí, la ventaja de los métodos de conjunto siempre ha estado ahí para que podamos beneficiarnos.

La lección más importante no tiene nada que ver con los algoritmos, porque Netflix nunca implementó el algoritmo que ganó el Desafío de Netflix. La razón es muy simple: cuando publicaron los datos, casi todo su negocio estaba en alquiler de DVD, pero al final del concurso, se habían pasado a hacer principalmente la transmisión de video. Esto es importante porque los consumidores no eligen películas para ver en este momento de la misma manera que lo hacen en pocos días, y como resultado, las recomendaciones hechas por un algoritmo basado en los datos de alquiler simplemente no funcionaron. bien. La lección para empresas e investigadores es que no importa cuán buenas sean sus predicciones si no puede ganar dinero con ellas.

Lección clave: antes de que sea demasiado tarde, guarde en caché localmente los datos aportados por cualquier empresa comercial al Depósito de Aprendizaje Automático de UCI … en caso de que los abogados entren y estropeen la diversión …