¿Hay tutoriales o trabajos de investigación sobre la presentación de problemas matemáticos como pseudolenguaje al algoritmo de PNL?

Las técnicas de PNL han encontrado muchas aplicaciones para datos no textuales. Aquí hay un breve ejemplo: Item2Vec: incrustación de elementos neuronales para el filtrado colaborativo

Skip-Gram with Negative Sampling, también conocido como modelo Word2Vec, se ha aplicado con éxito a los datos de las cestas de mercado. La aplicación de Word2Vec es sencilla una vez que nos damos cuenta de que una secuencia de palabras es equivalente a un conjunto o canasta de elementos.
Después de aplicar Word2Vec a los datos de transacciones, puede obtener vectores de elementos. Los elementos similares (elementos que aparecen en el mismo “contexto”) parecen tener vectores cercanos.

Aquí está la incrustación de t-SNE para los vectores de elementos producidos por Item2Vec. Los elementos se colorean de acuerdo con los metadatos de género recuperados en la web.

Otro algoritmo de PNL que puede aplicar a datos no textuales es la asignación de dirichlet latente. Este modelo se desarrolló inicialmente para encontrar temas latentes en el corpus de documentos. Sin embargo, también es posible considerar elementos como palabras y secuencias de acciones ‘agregar al carrito’ como oraciones. Al aplicar LDA a los datos de transacciones, podrá agrupar a los usuarios según sus intereses (“temas”).

Otras posibles aplicaciones:

  1. Empleo de la asignación de Dirichlet latente para la detección de fraudes en telecomunicaciones
  2. Asignación de Dirichlet semi-latente: un modelo jerárquico para el reconocimiento de la acción humana

Te deseo buena suerte con la implementación de tu idea 🙂