¿Qué son los espacios latentes en el aprendizaje de representación?

Tomemos como ejemplo el algoritmo word2vec.

Queremos obtener ‘ representaciones latentes ‘ de palabras como vectores en R ^ n Space. Aquí está la explicación:

Dictionary = [‘I’, ‘love’, ‘to’, ‘hotel’, ‘motel’, ‘Sleep’]

Me encantan los hoteles = [1, 1, 0, 1, 0, 0]
Me encantan los moteles = [1, 1, 0, 0, 1, 0]

Ambas oraciones son muy similares en términos de significado, pero se asignan a espacios muy diferentes (en 6 dimensiones)
La representación latente tiene como objetivo explotar la ” cercanía semántica ” de las palabras basándose en su contexto de ocurrencia para establecer una relación significativa. Esperamos representaciones en un espacio que pueda capturar la relación ‘latente’

hotel = [0, 0, 0, 1, 0, 0], motel = [0, 0, 0, 0, 1, 0] # Codificación en caliente
hotel = [2, 3] y motel = [2, 3.5] (Obtención en representación 2-D)

La segunda representación, se mapea en un espacio de aprendizaje de representación de espacio 2D que codifica la relación ‘ Latente ‘ entre las palabras.

Espero que esto tenga sentido. ¡Salud!

Deep LearningMachine Learning

Related Content

¿Es la informática de alto rendimiento un conocimiento esencial para el aprendizaje profundo dado que se trata de una gran red neuronal?

¿Cómo es posible combinar el desarrollo web con el aprendizaje automático?

¿Qué herramienta es mejor para aprender una red neuronal AI, C ++ o MATLAB?

¿Qué IIT en India tiene el mejor programa de CS para el aprendizaje automático?

¿Cuáles son los inconvenientes de usar RL con funciones de aproximación en altas dimensiones? ¿Cómo aprender la función de recompensa 0-1 (regresión logística)?

¿Cómo empiezo a aprender las matemáticas y teorías necesarias para las redes neuronales y la IA?

¿Es posible que una máquina de IA en el futuro descubra o pruebe una ley de la naturaleza por sí misma?

More Interesting

¿Cuáles son los puntos importantes de comparación entre Mahout y otras bibliotecas Java ML como Lingpipe o Weka?

¿Cuál es la mejor manera de implementar mi algoritmo de reducción de dimensiones?

¿Qué distingue una capa de una red neuronal de otras capas?

Cómo saber si Deep Learning funcionará mejor para un problema específico, que SVM o bosque aleatorio

¿Cuáles son mis próximos pasos en el aprendizaje automático después de aprender estadísticas y álgebra lineal?

¿El aprendizaje profundo ha vuelto obsoletos los métodos del núcleo?

¿Cuáles fueron los algoritmos utilizados para los chatbots antes de que surgiera el aprendizaje profundo?

¿Por qué alguien querría usar el refuerzo sobre el apilamiento?

¿Cuáles son las principales conferencias sobre inteligencia artificial, procesamiento del lenguaje natural y aprendizaje automático?

¿Cuánto tiempo le lleva a un programador experimentado aprender el aprendizaje automático?

¿Qué es la regularización de Tikhonov en términos simples?

¿Por qué utilizamos el CDF de distribución logística para calcular las probabilidades en la regresión logística?

¿Cuál es el peor caso de sobreajuste que hayas visto en entornos sociales o psicológicos?

¿Sigue siendo el curso de aprendizaje automático de Andrew Ng el mejor curso de aprendizaje automático disponible?

¿Qué algoritmo sería bueno para asignar una probabilidad a la coincidencia de dos nombres (John Doe = Mr. Jonathan M Doe II)?

Web Analytics