¿Es indistinguible si el método t-SNE no muestra dos grupos claros (para un problema de clasificación de 2 clases)?

Como de costumbre, hay una respuesta teórica y práctica.

La respuesta teórica es que las clases pueden ser separables por algún clasificador y mostrarse como una mezcla en 2D o 3D usando t-SNE.

La respuesta práctica es que cuando t-SNE muestra las clases muy mezcladas, generalmente no son fáciles de separar. Los modelos no lineales, los conjuntos y el apilamiento pueden ayudarlo a obtener muy buenos resultados.

Un buen ejemplo de esto fue el desafío de Otto en Kaggle:
En este gráfico podemos ver que algunas clases son fáciles de separar pero otras están completamente mezcladas. El concurso mostró que separar esas clases era una tarea difícil, apilar a través de varios modelos diferentes era probablemente la mejor opción para esos casos difíciles.

Entonces, la respuesta es que si bien en teoría t-SNE podría equivocarse y las clases se pueden separar con facilidad mediante algún algoritmo en la práctica cada vez que t-SNE muestra un desastre, el problema probablemente sea desordenado.

Luis.

Creo que dos razones son posibles:

1. Pueden ser linealmente separables, pero t-SNE elige diferentes proyecciones donde la separación no es visible.

2. No se pueden separar LINEALMENTE. Sin embargo, puede haber una forma más sofisticada (no lineal) de separarlos.

More Interesting

Quiero extraer acciones del texto y la entidad que actuó y sobre la que se actúa. Cómo proceder ?

¿Cuáles son algunas posibles aplicaciones interesantes del aprendizaje automático?

¿Cuál es el plan de estudios de maestría de Stanford en AI / ML?

¿Cuáles son las aplicaciones del error cuadrático medio?

¿Qué paquete de aprendizaje profundo es el mejor?

¿Es incorrecto si realizo un análisis de opinión en revisiones individuales en lugar de en todas las revisiones a la vez?

¿Qué recursos sobre modelos gráficos se recomiendan para los estudiantes de aprendizaje automático que desean ingresar al campo?

¿Por qué la probabilidad condicional es más poderosa que la probabilidad conjunta en un nivel intuitivo?

Suponga que la máquina es multinúcleo, el tiempo de ejecución de un programa en una máquina que ejecuta solo ese proceso es igual al tiempo de ejecución en una máquina en la que hay otros procesos ejecutados junto con él, ¿no es así?

¿Cuáles son algunos algoritmos de corrección ortográfica que usan los motores de búsqueda? Por ejemplo, cuando utilicé Google para buscar "imágenes de Google", me preguntó: "¿Quiso decir: imágenes de Google?".

¿Cuál es la intuición detrás de la propagación hacia atrás?

¿La IA tradicional se está volviendo obsoleta a la luz del progreso en el aprendizaje profundo?

¿Le resulta aburrido resolver los problemas de aprendizaje automático tipo kaggle intelectualmente aburrido (en comparación con la programación competitiva, por ejemplo)?

¿Cómo puede un estado en el aprendizaje por refuerzo tener dos valores? Por ejemplo, como en el blackjack donde el as es 1 u 11.

¿Qué tan difícil sería implementar el aprendizaje por refuerzo para un juego de mesa?