¿Es la reducción de dimensionalidad igual que la selección de características? ¿Cómo hacer la selección de características usando PCA en R?

Corto y al grano:

  1. La reducción de dimensionalidad no es lo mismo que la selección de características. La reducción de la dimensionalidad consiste en la extracción de características (por ejemplo, PCA) y la selección de características (selección de subconjunto similar). Para más detalles: Respuesta de Prem R. Adhikari a ¿Cuáles son las explicaciones de los términos reducción de dimensión, selección de características y extracción de características?
  2. No puede obtener un subconjunto exacto de características con PCA. PCA transformará sus datos en la dirección de mayor variación, es decir, convierte los datos en datos completamente nuevos. Después de PCA, el primer componente principal sería el predictor más importante en el sentido de que explica la mayor variación en los datos, el segundo el mejor, y así sucesivamente.
  3. PCA en R: ejemplo crudo usando Iris Dataset

    datos (iris)
    irispca <-princomp (iris [-5]) #remove la quinta columna que es factor (Species)
    two_princomp <- cbind (iris [5], irispca $ puntuaciones [, 1: 2])
    # Use forrest aleatorio para la clasificación
    biblioteca (randomForrest)
    rf.iris.princomp = randomForest (Species ~., data = two_princomp, importancia = VERDADERO)
    plot (rf.iris.princomp)

El resultado es un bosque aleatorio con un error del 6%. Como se muestra en el gráfico a continuación:

More Interesting

¿Qué significa el siguiente pasaje de un documento de aprendizaje profundo sobre aprendizaje automático sobre representaciones distribuidas frente a representaciones no distribuidas?

¿Vale la pena aprender Machine Learning (y AI) si quiero seguir la carrera de Ingeniero Embebido?

¿Por qué elegiría algoritmos de selección de características sobre la reducción dimensional?

¿Debo usar la validación cruzada k-fold para un clasificador de bosque aleatorio?

¿AWS es bueno para ejecutar proyectos de aprendizaje profundo? ¿Qué tan rápido y costoso sería entrenar una red convolucional en aproximadamente 1 millón de imágenes?

¿Dónde puedo encontrar un buen tutorial para la red neuronal de convolución regional?

¿Quiénes son los mejores ingenieros de aprendizaje automático?

¿Cuál debería ser el plan adecuado para aprender el aprendizaje automático desde cero para un estudiante del tercer semestre?

¿Podemos usar un algoritmo no supervisado para realizar análisis de sentimientos?

¿Podemos lograr mejor que una disminución sub-lineal en el error al aumentar el número de muestras en regresión lineal?

¿Cuál es el asistente virtual personal más avanzado?

¿Cómo funciona la extracción de características en el procesamiento de imágenes?

¿Cuáles son los requisitos previos para aprender Machine Learning?

¿Cuáles son algunos desarrollos interesantes pero pasados ​​por alto en la investigación de ML?

¿Es un doctorado en inteligencia artificial una cosa? ¿O el doctorado estaría realmente en aprendizaje automático / visión artificial, etc.?