Para un problema de clasificación supervisada, primero busque grupos a través de un algoritmo de aprendizaje no supervisado, y para los miembros en el mismo grupo, asigne la misma etiqueta según un voto mayoritario. ¿Funciona bien?

Te sugiero que realices un enfoque de aprendizaje semi supervisado en lugar de uno puramente sin supervisión. Realizar un aprendizaje no supervisado antes del aprendizaje supervisado puede conducir a mejores resultados, ya sea en términos de una convergencia más rápida o mejores predicciones o ambas.

Un ejemplo de este enfoque es usar una Red de base radial en la que inicializar los centros en función de k significa agrupamiento y luego usar redes RBF para las predicciones. Tal enfoque asegura una convergencia más rápida y un mejor poder predictivo.

Otro ejemplo sería RBM. Técnicas como las máquinas de Boltzmann restringidas pueden dar buenas aproximaciones iniciales de los pesos para los modelos de aprendizaje profundo . El RBM es un aprendizaje no supervisado, pero puede ayudarnos a mejorar los problemas que enfrentamos mientras entrenamos una red neuronal profunda.

Gracias por A2A

Algunas veces su enfoque será lo suficientemente bueno cuando desee realizar una clasificación binaria. Cuando tenemos más variables de predicción, creo que no es una buena idea realizar tanto el cultivo como la clasificación para un problema de clasificación. pero sabes que las cosas cambiarán según el problema. Entonces, mi solicitud es que primero realice la clasificación usando SVM o bosque aleatorio o algoritmos de árbol de decisión y encuentre la precisión. Luego aplique su forma de resolver el problema y compare el resultado. por favor comparta cuál es el mejor enfoque.

¿Por qué harías clustering si tu objetivo es la clasificación? Ambas son tareas diferentes. Si realmente quieres hacer clustering, entonces deberías asumir que los clusters generados son iguales al número de clases. Pero esta información se puede obtener directamente de las etiquetas de clase presentes en los datos, ¿así que de inmediato se hace la clasificación? Aunque algunas personas hacen la clasificación a través de la agrupación (Formato de documento portátil (PDF)) como un enfoque de meta-clasificación, pero es necesario tener una base sólida para hacerlo.

Semi-supervisado solo tiene sentido si tiene algunos datos etiquetados y algunos (o muchos) datos no etiquetados. ¿Cómo lograrías el voto mayoritario como sugeriste? ¿Está creando conjuntos de grupos o clasificación? Esto parece muy confuso.

Creo que primero mire sus datos y razone por qué desearía aplicar un enfoque particular: siempre comience con ideas simples y no se confunda con pensamientos múltiples, complejos e incoherentes.

Es difícil responder a esta pregunta sin verla realmente. Le sugiero que lo implemente, lo juegue y lo evalúe utilizando la clasificación precisión / precisión / recuperación. Encontrarás la respuesta entonces.

Parece que está describiendo el algoritmo de vecinos k más cercanos que utiliza el agrupamiento como precursor de la clasificación o regresión.