Como de costumbre, hay una respuesta teórica y práctica.
La respuesta teórica es que las clases pueden ser separables por algún clasificador y mostrarse como una mezcla en 2D o 3D usando t-SNE.
La respuesta práctica es que cuando t-SNE muestra las clases muy mezcladas, generalmente no son fáciles de separar. Los modelos no lineales, los conjuntos y el apilamiento pueden ayudarlo a obtener muy buenos resultados.
- ¿Cuál es el mejor lenguaje para el procesamiento del lenguaje natural?
- Análisis de sentimientos: ¿cuál es una manera simple de identificar palabras de sentimientos en una oración?
- ¿Qué significa 'estimación ML o MAP no captura la incertidumbre de los parámetros'?
- ¿Cómo debo prepararme para Shogun Machine Learning Toolbox en GSoC? ¿Es difícil ser seleccionado en Shogun?
- ¿Debería un científico de datos novato centrarse en conceptos matemáticos o herramientas?
Un buen ejemplo de esto fue el desafío de Otto en Kaggle:
En este gráfico podemos ver que algunas clases son fáciles de separar pero otras están completamente mezcladas. El concurso mostró que separar esas clases era una tarea difícil, apilar a través de varios modelos diferentes era probablemente la mejor opción para esos casos difíciles.
Entonces, la respuesta es que si bien en teoría t-SNE podría equivocarse y las clases se pueden separar con facilidad mediante algún algoritmo en la práctica cada vez que t-SNE muestra un desastre, el problema probablemente sea desordenado.
Luis.