¿Qué son las máquinas de factorización y cómo se usan en el aprendizaje automático? La tecnología cambia la vida futura

¿Qué son las máquinas de factorización y cómo se usan en el aprendizaje automático?

Aquí hay algunos datos básicos sobre las máquinas de factorización (FM):

Son modelos de aprendizaje supervisado.
Pueden hacer tanto regresión como clasificación.
Son modelos no lineales
Por lo general, están entrenados por el descenso de gradiente estocástico (SGD), el mínimo cuadrado alternativo (ALS) o la cadena de Markov Monte Carlo (MCMC)
Modelan interacciones de variables al mapearlas (las interacciones) a un espacio dimensional bajo. Por ejemplo, si la interacción de segundo orden entre las dimensiones di y dj está representada por [matemática] wij * xi * xj [/ matemática], donde wij es el parámetro que le interesa aprender. FM modela wij como el producto punto de dos vectores específicos de dimensión vi y vj. La dimensión d de los vectores vi y vi se elige antes de entrenar el modelo, es decir, es un hiperparámetro. Si la dimensión de sus datos de entrenamiento es D, en lugar de aprender todos los parámetros de interacción de segundo orden DxD, aprenderá los parámetros Dxd que son los elementos de los vectores de dimensión v.

Así, el número de parámetros crece linealmente con la dimensión
No necesita observar la coincidencia de xi y xj para aprender wij, aprende vi por xi interactuando con cualquier otra dimensión, y vj por xj interactuando con cualquier otra dimensión, el producto puntual de vi y vj aún le da wij. Esto es útil para los sistemas de recomendación.

El rendimiento (precisión, etc.) de FM se debe considerar de vanguardia
FM es una generalización de algunos modelos de factorización, incluida la factorización matricial, svd ++, etc.
FM llamó la atención cuando su autor Steffen Randle ganó la cuarta posición en ambas pistas en la Copa KDD 2012.
Algunos softwares de código abierto están disponibles. El autoritario es la libfm de Steffen (Descargar de libFM). También puede encontrar una lista de publicaciones clave en su sitio web.
Una variante importante de FM son las máquinas de factorización de campo (FFM). Mostró muy buen rendimiento en algunas competiciones de aprendizaje automático.

Es de código abierto por el grupo de aprendizaje automático de la Universidad Nacional de Taiwán. Puede encontrar más detalles aquí: LIBFFM: una biblioteca para máquinas de factorización de campo.

Es posible que deba agregar una variable ficticia 1 para asegurarse de que los términos de sesgo estén capacitados