Como no he aplicado personalmente algoritmos de agrupamiento (o de hecho ningún ML) a tales conjuntos de datos, no puedo decir con certeza. De hecho, esto generalmente dependerá del conjunto de datos específico, es decir, generalmente no existe un solo ‘mejor algoritmo’ para nada, ni siquiera para la agrupación. A veces uno funciona mejor, otras veces funciona mejor.
Sin embargo, sugeriría que con pocas (digamos <10) variables y no demasiadas (digamos <50K puntos en total) algunos de los algoritmos de agrupación estándar como K-Means y Fuzzy C Means le darán algunas pistas de lo que podría seguir adelante Sin embargo, tenga en cuenta que algunos de esos dos algoritmos particulares crearán límites lineales entre los grupos: líneas nítidas en el primer caso y líneas difusas (probabilísticas) en el último caso. Esto puede o no estar bien, dependiendo de la complejidad de las relaciones entre las características. Para relaciones más complejas y no lineales, puede probar el aprendizaje no supervisado de sus características.
Mezclar una imagen con otros datos no es imposible, pero hace las cosas más difíciles, a menos que primero entrene un ConvNet separado con imágenes y alguna otra característica como etiqueta.
- ¿Por qué hay una necesidad de matrices dinámicas si tenemos matrices de longitud variable?
- ¿Cuáles son las mejores prácticas para usar algoritmos de Machine Learning con Android?
- ¿Podemos implementar la estructura de datos de la cola usando la estructura de datos de la pila?
- ¿Cuál es la probabilidad de que 2 números sean iguales en una lista aleatoria de n números de m dígitos?
- ¿Cuáles son algunas de las estructuras de datos / algoritmos de clasificación más interesantes?