Cómo usar el aprendizaje automático para encontrar usuarios similares

Imagine que tenemos una matriz de usuario contra tema, cada elemento en la matriz representa un puntaje entre 0 y 1 para la preferencia que un usuario tiene sobre ese tema.

OK para que pueda tomar el coseno de dos usuarios para determinar su similitud.

Ahora imagine un nuevo usuario y quiero identificar esta preferencia de los usuarios para cada tema haciendo la menor cantidad de preguntas posibles, ¿cómo puedo lograr esto?
Teóricamente, ¿hay algún punto en el que la velocidad de viaje de la información se convierta en una restricción para el diseño de una computadora?
¿Quiénes son algunos de los mejores consultores de raspado de datos?
¿Pueden las computadoras escribir sus propios algoritmos?
¿Dónde puedo encontrar datos para practicar la ciencia de datos?
¿Cuáles son algunos proyectos relacionados con FPGAs para el dominio ECE?

Depende de los datos … Pero probablemente comenzaría con una regresión o algo así para ver si alguno de los temas está altamente correlacionado. Quizás agregue algunos términos de interacción.

Más allá de eso, buscaría en la agrupación.

Pero depende de los datos. Técnicamente, podría no haber una correlación útil y es posible que no obtenga ningún apalancamiento, pero también conocer los datos le permitirá elegir mejor el tipo de algoritmo y ajustar los parámetros para encontrar un buen ajuste.

Aprendizaje automáticoClasificacióninformáticaInteligencia Artificial

Related Content

¿Cómo difiere el proceso de solicitud para los Premios de Investigación de Google del proceso de solicitud de subvención académica estándar?

¿Cómo utiliza Google Latitude el dispositivo GPS?

¿Es posible que el aprendizaje automático muera en los próximos 5 años?

¿Podría la tecnología VR salvar o destruir el planeta? Si tener relaciones sexuales con realidad virtual es tan bueno, las únicas personas que tienen relaciones sexuales reales serían aquellas que desean formar una familia.

¿Qué es la búsqueda de interpolación en estructuras de datos?

Cómo optimizar el uso de mi computadora para hacer frente a la miopía

¿Qué servicio de banda ancha en Madurai es el mejor?

descomposición de valores singulares -> k-means -> k-nn condicional es un buen primer paso.

el hashing sensible a la localidad es un buen algoritmo aleatorio para una recuperación bastante rápida ~ kNN

Patrick Harrington

More Interesting

Cómo determinar el tamaño de un archivo de video

MIT Manipal vs PESIT BMS para CSE?

¿Alguien ha integrado Scrum con un método de cascada tradicional como PRINCE2 o PMP? ¿Qué tan exitosos han sido tus intentos?

¿Qué tan bueno es el departamento de informática de la Universidad de Rice?

¿Cómo funciona la informática afectiva?

¿Qué es el algoritmo LWL (aprendizaje ponderado localmente) sobre el aprendizaje automático? ¿Me puede dar alguna información al respecto?

¿Vale la pena tomar CS 161 (sistemas operativos) en Harvard?

¿Qué es una hoja de ruta UX? ¿Cuándo y por qué se crea?

¿Qué es un hacker?

¿Cuáles son algunos de los conceptos más interesantes de las matemáticas?

¿Qué puedo hacer cuando llegue a UDUB para ser un gran candidato para UWCSE?

A partir de 2016, ¿es cierto que el navegador Safari de Apple es un navegador más rápido que el navegador Chrome de Google?

¿Recomiendas estudiar el enfoque bayesiano hacia el aprendizaje automático?

Bajo el esquema de codificación de caracteres de Windows, ¿cómo se relaciona el juego de caracteres chino tradicional con el juego de caracteres chino simplificado?

Criptografía: ¿Cuál es una explicación intuitiva de una red de sustitución-permutación?

Web Analytics