Cuando dice que “el número de atributos es diferente en el conjunto de prueba”, quiere decir que los atributos seleccionados después de la selección de características en el conjunto de entrenamiento son un subconjunto de todos los atributos presentes para el conjunto de prueba. Es decir, antes de la selección de características, los atributos tanto para la prueba como para el conjunto de trenes eran los mismos. ¿¿Derecho??
En este caso, dado que la selección de funciones le dio los mejores atributos para clasificar el conjunto de datos de entrenamiento, debe seleccionar solo los mismos atributos para el conjunto de prueba (tal vez escriba un script para esta selección) y luego continúe con el paso de prueba / validación.
Porque, los atributos en el tren y el conjunto de prueba deben ser los mismos. Además, los datos de la prueba serán similares a los datos de entrenamiento y, por lo tanto, seleccionar los mismos atributos para los datos de entrenamiento también será potencialmente el mejor para los datos de prueba.
- ¿Existe una API para reconocimiento facial?
- ¿Cuáles son algunos casos de uso para el aprendizaje automático en realidad virtual?
- ¿Qué papel jugará la ciencia de datos en las elecciones presidenciales de 2012?
- ¿Cuáles son las diferencias en las aplicaciones de filtrado colaborativo en los datos de calificación y en los datos de compra?
- ¿En qué técnicas de aprendizaje automático se puede confiar para identificar (y posiblemente tratar) la deriva del concepto?
¿Es esto lo que estabas preguntando? Espero no haber entendido mal su pregunta. ¡Házmelo saber!