¿Qué son las máquinas de factorización y cómo se usan en el aprendizaje automático?

Aquí hay algunos datos básicos sobre las máquinas de factorización (FM):

  • Son modelos de aprendizaje supervisado.
  • Pueden hacer tanto regresión como clasificación.
  • Son modelos no lineales
  • Por lo general, están entrenados por el descenso de gradiente estocástico (SGD), el mínimo cuadrado alternativo (ALS) o la cadena de Markov Monte Carlo (MCMC)
  • Modelan interacciones de variables al mapearlas (las interacciones) a un espacio dimensional bajo. Por ejemplo, si la interacción de segundo orden entre las dimensiones di y dj está representada por [matemática] wij * xi * xj [/ matemática], donde wij es el parámetro que le interesa aprender. FM modela wij como el producto punto de dos vectores específicos de dimensión vi y vj. La dimensión d de los vectores vi y vi se elige antes de entrenar el modelo, es decir, es un hiperparámetro. Si la dimensión de sus datos de entrenamiento es D, en lugar de aprender todos los parámetros de interacción de segundo orden DxD, aprenderá los parámetros Dxd que son los elementos de los vectores de dimensión v.
    • Así, el número de parámetros crece linealmente con la dimensión
    • No necesita observar la coincidencia de xi y xj para aprender wij, aprende vi por xi interactuando con cualquier otra dimensión, y vj por xj interactuando con cualquier otra dimensión, el producto puntual de vi y vj aún le da wij. Esto es útil para los sistemas de recomendación.
  • El rendimiento (precisión, etc.) de FM se debe considerar de vanguardia
  • FM es una generalización de algunos modelos de factorización, incluida la factorización matricial, svd ++, etc.
  • FM llamó la atención cuando su autor Steffen Randle ganó la cuarta posición en ambas pistas en la Copa KDD 2012.
  • Algunos softwares de código abierto están disponibles. El autoritario es la libfm de Steffen (Descargar de libFM). También puede encontrar una lista de publicaciones clave en su sitio web.
  • Una variante importante de FM son las máquinas de factorización de campo (FFM). Mostró muy buen rendimiento en algunas competiciones de aprendizaje automático.
    • Es de código abierto por el grupo de aprendizaje automático de la Universidad Nacional de Taiwán. Puede encontrar más detalles aquí: LIBFFM: una biblioteca para máquinas de factorización de campo.
      • Es posible que deba agregar una variable ficticia 1 para asegurarse de que los términos de sesgo estén capacitados
      • Puede que solo se base en Linux

Estos son algunos de los estados de los métodos, han trabajado en algunos casos de uso convincentes utilizando variaciones de máquinas de factorización, ¿alguien puede señalar algunas diferencias sutiles entre FM y Field Aware FM? Leí el documento, pero en las implementaciones prácticas de Publicación de anuncios, Recomendaciones, Capacitación en línea, cualquiera tenía puntos de referencia o resultados específicos en los que FFM funcionaba mejor o peor que los modelos FM.