Para un problema de clasificación supervisada, primero busque grupos a través de un algoritmo de aprendizaje no supervisado, y para los miembros en el mismo grupo, asigne la misma etiqueta según un voto mayoritario. ¿Funciona bien?

Te sugiero que realices un enfoque de aprendizaje semi supervisado en lugar de uno puramente sin supervisión. Realizar un aprendizaje no supervisado antes del aprendizaje supervisado puede conducir a mejores resultados, ya sea en términos de una convergencia más rápida o mejores predicciones o ambas.

Un ejemplo de este enfoque es usar una Red de base radial en la que inicializar los centros en función de k significa agrupamiento y luego usar redes RBF para las predicciones. Tal enfoque asegura una convergencia más rápida y un mejor poder predictivo.

Otro ejemplo sería RBM. Técnicas como las máquinas de Boltzmann restringidas pueden dar buenas aproximaciones iniciales de los pesos para los modelos de aprendizaje profundo . El RBM es un aprendizaje no supervisado, pero puede ayudarnos a mejorar los problemas que enfrentamos mientras entrenamos una red neuronal profunda.

AprendizajeAprendizaje automáticoAprendizaje no supervisadoClasificación (aprendizaje automático)

De estos cursos, ¿cuál debería tomar más si quiero investigar en reconocimiento de patrones o visión por computadora?

¿Cómo lidiamos con el conjunto de datos que tiene 3 variables categóricas de 10 variables usando regresión logística?

¿Cómo se calculan los intervalos de confianza en un conjunto de características?

¿Se moverá el conjunto de problemas ICPC para incluir sistemas distribuidos y aprendizaje automático en el futuro?

Cómo comprar juegos de PC a bajo precio

¿Cómo se pueden utilizar los autoencoders apilados para preentrenar una red neuronal que tiene más neuronas en las capas ocultas que entradas? es posible?

Gracias por A2A

Algunas veces su enfoque será lo suficientemente bueno cuando desee realizar una clasificación binaria. Cuando tenemos más variables de predicción, creo que no es una buena idea realizar tanto el cultivo como la clasificación para un problema de clasificación. pero sabes que las cosas cambiarán según el problema. Entonces, mi solicitud es que primero realice la clasificación usando SVM o bosque aleatorio o algoritmos de árbol de decisión y encuentre la precisión. Luego aplique su forma de resolver el problema y compare el resultado. por favor comparta cuál es el mejor enfoque.

Divyansh Agarwal

¿Por qué harías clustering si tu objetivo es la clasificación? Ambas son tareas diferentes. Si realmente quieres hacer clustering, entonces deberías asumir que los clusters generados son iguales al número de clases. Pero esta información se puede obtener directamente de las etiquetas de clase presentes en los datos, ¿así que de inmediato se hace la clasificación? Aunque algunas personas hacen la clasificación a través de la agrupación (Formato de documento portátil (PDF)) como un enfoque de meta-clasificación, pero es necesario tener una base sólida para hacerlo.

Semi-supervisado solo tiene sentido si tiene algunos datos etiquetados y algunos (o muchos) datos no etiquetados. ¿Cómo lograrías el voto mayoritario como sugeriste? ¿Está creando conjuntos de grupos o clasificación? Esto parece muy confuso.

Creo que primero mire sus datos y razone por qué desearía aplicar un enfoque particular: siempre comience con ideas simples y no se confunda con pensamientos múltiples, complejos e incoherentes.

Divyansh Agarwal

Es difícil responder a esta pregunta sin verla realmente. Le sugiero que lo implemente, lo juegue y lo evalúe utilizando la clasificación precisión / precisión / recuperación. Encontrarás la respuesta entonces.

Jagadeesh Rajarajan

Parece que está describiendo el algoritmo de vecinos k más cercanos que utiliza el agrupamiento como precursor de la clasificación o regresión.

Divyansh Agarwal

More Interesting

¿Qué enfoques utilizas para vectorizar funciones en Matlab?

¿Cuál es la diferencia entre el entrenamiento por lotes, en línea y mini-lote en redes neuronales? ¿Cuál debo usar para un conjunto de datos de pequeño a mediano tamaño con fines de predicción?

¿Qué parte de la investigación de aprendizaje profundo es empírica versus teórica?

¿Por qué es tan importante aprender las redes neuronales convolucionales?

¿Qué es la validación cruzada?

¿Qué ha aprendido sobre el aprendizaje automático, la recuperación de información y la minería de datos después de unirse a una empresa de Internet que se ocupa de big data?

¿Cómo se debe contactar a los autores de los libros blancos (y cómo hacer que respondan)?

¿Qué método de aprendizaje profundo es el más adecuado para PNL?