¿Cuál es la filosofía de la matriz, la descomposición del tensor para encontrar la estructura latente?

No sé mucho sobre las descomposiciones de tensor y sus usos. Entonces, me limitaré a la descomposición de la matriz. Comenzaré con un ejemplo, un lugar donde ha tenido éxito.

El premio de Netflix: El premio de Netflix fue una competencia iniciada por Netflix en el año 2006 para mejorar (o vencer) su algoritmo de recomendación Cinematch. Netflix anunció que le darían un millón de dólares a la persona que supera Cinematch en un 10%. Proporcionaron los datos. Los datos fueron de 100 millones de calificaciones de 500K clientes en casi 17K películas. La competencia terminó en 2009. El ingrediente clave de la solución ganadora fue la factorización matricial.

La filosofía
Considere el problema de recomendación de la película. Si te pregunto qué tipo de películas te gustan? Puede responder cosas como: le gustan las películas con acción, ciencia ficción, comedia, románticas, películas dirigidas por Christopher Nolan, James Cameron, Steven Speilberg, etc., películas con Tom Cruise , Kate Winslet. Estas son solo algunas cosas que afectarán sus preferencias de películas. Es posible que no le gusten todas las películas de Steven Speilberg o que no odie todas las películas basadas en extraterrestres. Por lo tanto, incluso para usted puede ser realmente difícil establecer exactamente todas las condiciones que realmente afectan su gusto por una película. Estos factores ocultos son las cosas que los modelos de factores latentes realmente intentan descubrir. Aunque no podrás decir cuáles son esos factores.
¿Qué intenta darle la factorización matricial? Supongamos que Dios (o la naturaleza) pretendía tener exactamente 50 cosas (de las cuales no tenemos idea) que realmente deberían afectar nuestras elecciones de películas. Luego, el método de factorización matricial intenta representarte como un vector en este espacio de 50 dimensiones (en lo que respecta a la recomendación de la película, eres equivalente a este vector). También producirá un vector de 50 dimensiones para cada película (de nuevo, en lo que respecta a la recomendación de la película, estos vectores son la verdadera representación final de las películas). Por lo tanto, la calificación que le dará a una película es solo un producto de punto entre los vectores que lo representan a usted y a la película, respectivamente, en este espacio de 50 dimensiones.

Machine Learning