¿Qué son los espacios latentes en el aprendizaje de representación?

Tomemos como ejemplo el algoritmo word2vec.

Queremos obtener ‘ representaciones latentes ‘ de palabras como vectores en R ^ n Space. Aquí está la explicación:

  • Dictionary = [‘I’, ‘love’, ‘to’, ‘hotel’, ‘motel’, ‘Sleep’]
    • Me encantan los hoteles = [1, 1, 0, 1, 0, 0]
    • Me encantan los moteles = [1, 1, 0, 0, 1, 0]
  • Ambas oraciones son muy similares en términos de significado, pero se asignan a espacios muy diferentes (en 6 dimensiones)
  • La representación latente tiene como objetivo explotar la ” cercanía semántica ” de las palabras basándose en su contexto de ocurrencia para establecer una relación significativa. Esperamos representaciones en un espacio que pueda capturar la relación ‘latente’
    • hotel = [0, 0, 0, 1, 0, 0], motel = [0, 0, 0, 0, 1, 0] # Codificación en caliente
    • hotel = [2, 3] y motel = [2, 3.5] (Obtención en representación 2-D)
  • La segunda representación, se mapea en un espacio de aprendizaje de representación de espacio 2D que codifica la relación ‘ Latente ‘ entre las palabras.

Espero que esto tenga sentido. ¡Salud!

More Interesting

¿Cuáles son los puntos importantes de comparación entre Mahout y otras bibliotecas Java ML como Lingpipe o Weka?

¿Cuál es la mejor manera de implementar mi algoritmo de reducción de dimensiones?

¿Qué distingue una capa de una red neuronal de otras capas?

Cómo saber si Deep Learning funcionará mejor para un problema específico, que SVM o bosque aleatorio

¿Cuáles son mis próximos pasos en el aprendizaje automático después de aprender estadísticas y álgebra lineal?

¿El aprendizaje profundo ha vuelto obsoletos los métodos del núcleo?

¿Cuáles fueron los algoritmos utilizados para los chatbots antes de que surgiera el aprendizaje profundo?

¿Por qué alguien querría usar el refuerzo sobre el apilamiento?

¿Cuáles son las principales conferencias sobre inteligencia artificial, procesamiento del lenguaje natural y aprendizaje automático?

¿Cuánto tiempo le lleva a un programador experimentado aprender el aprendizaje automático?

¿Qué es la regularización de Tikhonov en términos simples?

¿Por qué utilizamos el CDF de distribución logística para calcular las probabilidades en la regresión logística?

¿Cuál es el peor caso de sobreajuste que hayas visto en entornos sociales o psicológicos?

¿Sigue siendo el curso de aprendizaje automático de Andrew Ng el mejor curso de aprendizaje automático disponible?

¿Qué algoritmo sería bueno para asignar una probabilidad a la coincidencia de dos nombres (John Doe = Mr. Jonathan M Doe II)?