Unidades visibles de Softmax
Estas no son más que unidades entre las cuales 1 y solo 1 nodo deben estar activos. En su caso, estos son los distintos niveles de calificación para cada artículo. La idea es que, basándose en los valores de todas las unidades, usted decidirá cuál debe activarse. En otras palabras, el sesgo que ves en otras redes neuronales no es dinámico.
Si terminé confundiéndote con eso, aquí hay una mirada diferente a la misma.
Le preguntas a 10 personas si, según su experiencia, ¿te gustará la película? Todas te darán diferentes respuestas como: Definitivamente, en absoluto, un poco, etc.
La función softmax te ayuda a elegir una de estas de todas las respuestas que recibiste.
Mapeo de calificaciones
Las clasificaciones se asignan a binario en el siguiente formato:
1. ¿Es la calificación 1? Si no
2. ¿Es la calificación 2? Si no
y así.
Cada nodo se activa o desactiva en función del valor que está buscando. Al nodo uno solo le importa que la calificación sea 1 o no 1 (no diferencia entre 3 y 4)
- ¿Cuál es la diferencia entre bootstrapping y validación cruzada?
- ¿Cómo se determina el rango de posibles valores lambda cuando se realiza la validación cruzada en una regresión de lazo?
- ¿Qué tan buena será una carrera en IA / aprendizaje automático en el futuro?
- ¿Hay algún curso sobre blockchain, Python o aprendizaje automático durante un máximo de 6 meses en el extranjero que también pueda conseguirme un trabajo allí?
- ¿Debo hacer un gran proyecto de investigación de aprendizaje profundo con mi propio dinero (y tiempo), sin que me paguen, solo para que alguien pueda contratarme debido al trabajo?
Calificaciones faltantes
No manejas las calificaciones faltantes. Deje todos los nodos relacionados como desactivados / en blanco. Las matemáticas se encargarán de eso. ¿Cómo? así de simple. El entrenamiento de la red se basa en qué tan bueno es el partido, pero la red debe seleccionar exactamente un valor. La red intentará evolucionar para obtener tantos valores coincidentes como sea posible, pero fallará sin importar el valor que prediga. El ‘error’ total no cambiará. Esto significa que este valor faltante en particular no proporcionará información como ‘diferencial’. Por lo tanto, el algoritmo terminará siendo afectado por este valor faltante. Y ahí es donde entra en juego la parte de Filtrado Colaborativo. Todo el poder de la RBM es que, dado que encontró valores faltantes, ahora asignará valores basados en las calificaciones de otras personas similares.