Compresión de datos: después de hacer PCA, puede hacer que sus datos sean pequeños al disminuir el número de características (seleccionando solo k características de n) que es lo que hace la compresión de datos. Suponga que tiene datos tridimensionales y desea hacerlo bidimensional, para eso dibujamos un plano desde el cual la proyección de los puntos 3D al plano es mínima, por esto tenemos un plano ( 2D ) que contiene la información de 3D apunte a través de sus proyecciones (como la sombra contiene la información de longitud, anchura y altura del cuerpo).
Descompresión de datos: conociendo mis proyecciones en el plano 2D, ¿no podemos volver a proyectarlo en un espacio tridimensional nuevamente? (Si sabes cómo se ve el fósil, ¿no te imaginas cómo habría sido el dinosaurio?). 3D y 2D fueron solo un ejemplo de bajo nivel de compresión y descompresión, incluso se puede reducir el tamaño de la característica de 10,000 a 1000 reteniendo una variación del 99% mientras se vuelve a proyectar (suponiendo que el dinosaurio que extrajimos del fósil fuera correcto con el 99%).
Visualización de datos: si queremos saber cómo un clasificador dibuja límites entre ejemplos positivos y negativos o cómo se dividen las clases, podemos verlo con 9567 dimensiones (aleatorias). Para ver el rendimiento del clasificador o los límites o los datos visualmente, debemos condensar los datos de la entidad n en un espacio de 2 o 3 dimensiones (porque podemos dibujar gráficos solo en (2D o 3D).
- Cómo encontrar qué variable de característica es más predictiva en un problema de clasificación binaria
- ¿Quiénes son algunos de los principales profesores que enseñan Machine Learning en Europa?
- ¿Hay algún sitio web donde pueda encontrar ideas para mi tesis de licenciatura en Informática? (Estoy interesado en algoritmos y aprendizaje automático).
- ¿Cuál es la mejor manera de aprender la programación CUDA C para implementar nuevas ideas de aprendizaje profundo?
- ¿Cuál es un buen consejo para una implementación eficiente de un algoritmo de aprendizaje automático en C / C ++?
Acelerar el algoritmo: entrenar el modelo de aprendizaje automático en 100,000,000 funciones puede llevarme toda la vida en el procesador Pentium 4. Debemos condensar el tamaño de la función a un tamaño que sea menor que la función actual y tendría una variación del 99% (Búscalo en Google lo que significa) para mantener la precisión. Por lo tanto, mantener menos funciones (que contienen información sobre más funciones) disminuirá el tamaño del entrenamiento.
PCA en conceptos simples : para escribir las notas de clase en un libro que es 2D y contendría todos los puntos clave de la clase ( compresión de datos ) y después de lo cual, si lees o entrenas, recordarás lo que sucedió en clase o lo que dijo el profesor durante ese tiempo ( descompresión de datos ) y mientras lo lees, probablemente tengas menos tiempo para cubrir el semestre total en notas de 3 horas ( algoritmo de aceleración )