Imagine que tenemos una matriz de usuario contra tema, cada elemento en la matriz representa un puntaje entre 0 y 1 para la preferencia que un usuario tiene sobre ese tema.
OK para que pueda tomar el coseno de dos usuarios para determinar su similitud.
Ahora imagine un nuevo usuario y quiero identificar esta preferencia de los usuarios para cada tema haciendo la menor cantidad de preguntas posibles, ¿cómo puedo lograr esto?
- Teóricamente, ¿hay algún punto en el que la velocidad de viaje de la información se convierta en una restricción para el diseño de una computadora?
- ¿Quiénes son algunos de los mejores consultores de raspado de datos?
- ¿Pueden las computadoras escribir sus propios algoritmos?
- ¿Dónde puedo encontrar datos para practicar la ciencia de datos?
- ¿Cuáles son algunos proyectos relacionados con FPGAs para el dominio ECE?
Depende de los datos … Pero probablemente comenzaría con una regresión o algo así para ver si alguno de los temas está altamente correlacionado. Quizás agregue algunos términos de interacción.
Más allá de eso, buscaría en la agrupación.
Pero depende de los datos. Técnicamente, podría no haber una correlación útil y es posible que no obtenga ningún apalancamiento, pero también conocer los datos le permitirá elegir mejor el tipo de algoritmo y ajustar los parámetros para encontrar un buen ajuste.