Entre la agrupación y la clasificación, ¿cuál requiere más experiencia?

Es difícil, si no imposible, hacer tal juicio. Pero puedo hacer una comparación en algunos aspectos, lo que puede dar alguna idea.

En un curso típico de aprendizaje automático, la clasificación ocupa la mayor parte del semestre, mientras que la agrupación suele ser un pequeño porcentaje (tal vez 70% – 30%). Esto no significa que la clasificación sea más difícil, solo significa que hay una mayor variedad de técnicas y problemas bajo la clasificación / regresión del tema que bajo la agrupación en un currículo típico de ML. La agrupación gira en torno a métodos de agrupación k-medias, jerárquicos y quizás espectrales, que no son demasiado complicados en términos de la idea básica.

Por otro lado, la agrupación por su naturaleza es más un método de análisis de datos exploratorio donde se necesita mucha información y dirección humana. Usualmente no sabes lo que estás buscando e intentas encontrar algo útil. Y ahí es exactamente donde la experiencia funciona tan bien.

La agrupación en clústeres es un problema enorme y fundamental con aplicaciones en muchos campos, y las personas han tenido muchas ideas. Pero es un problema mal definido y eso lo hace menos estructurado que la clasificación. La naturaleza bien estructurada de la clasificación se presta a un vasto campo de teoría y técnicas, etc. Un vasto conjunto de herramientas y reglas significa que hay mucho espacio para desarrollar experiencia. Pero eso no significa que la agrupación sea superficial. Por el contrario, puede ser donde la experiencia realmente marca la diferencia porque podría decirse que la percepción importa más en la agrupación.

Ambos son campos igualmente avanzados y requieren igual esfuerzo. La pregunta es menos sobre experiencia y más sobre lo que quieres hacer. Ambos abordan dos aspectos diferentes del aprendizaje automático: mientras que la clasificación significa literalmente clasificar objetos en categorías predefinidas, la agrupación se realiza cuando los datos no están etiquetados y no sabemos cuántas categorías podrían existir.
Pregúntate cuál es más interesante para ti. En mi opinión, la comprensión de ambos es un requisito previo para desarrollar experiencia en cualquiera de ellos.