Después de la selección de características utilizando el método de rankeador, WEKA, el número de atributos en el conjunto de prueba es diferente del conjunto de entrenamiento. ¿Cómo los comparas?

Cuando dice que “el número de atributos es diferente en el conjunto de prueba”, quiere decir que los atributos seleccionados después de la selección de características en el conjunto de entrenamiento son un subconjunto de todos los atributos presentes para el conjunto de prueba. Es decir, antes de la selección de características, los atributos tanto para la prueba como para el conjunto de trenes eran los mismos. ¿¿Derecho??

En este caso, dado que la selección de funciones le dio los mejores atributos para clasificar el conjunto de datos de entrenamiento, debe seleccionar solo los mismos atributos para el conjunto de prueba (tal vez escriba un script para esta selección) y luego continúe con el paso de prueba / validación.

Porque, los atributos en el tren y el conjunto de prueba deben ser los mismos. Además, los datos de la prueba serán similares a los datos de entrenamiento y, por lo tanto, seleccionar los mismos atributos para los datos de entrenamiento también será potencialmente el mejor para los datos de prueba.

¿Es esto lo que estabas preguntando? Espero no haber entendido mal su pregunta. ¡Házmelo saber!

Aprendizaje automático

Related Content

Como principiante, ¿cómo debo estudiar el aprendizaje profundo?

¿Hay abandonos universitarios que trabajan como científicos de datos o especialistas en aprendizaje automático?

¿Cuáles son algunos buenos ejemplos donde el agrupamiento se usa como método para la extracción de características?

¿Alguien puede proporcionar ejemplos sobre cómo usar la biblioteca Shogun para modelos de Markov ocultos?

¿Dónde puedo encontrar algunas empresas que trabajen con técnicas de aprendizaje automático y minería de datos, en el campo biomédico?

¿Es posible combinar dos algoritmos no supervisados en serie para maximizar la precisión?

Quiero ser exhaustivo con programación y estadísticas en profundidad en poco tiempo. ¿Qué tengo que hacer? ¿Cuáles son algunos buenos libros para principiantes / intermedios?

More Interesting

¿Por qué debería obtener el doble de RAM que la memoria total de mi GPU para construir una plataforma de aprendizaje profundo?

¿Auto-sklearn es realmente mejor que un clasificador único optimizado por hiperparámetro? ¿Tienes experiencia con esto?

¿Qué se sabe sobre la detección de incertidumbre o vacilación en el texto en lenguaje natural (no en el habla)?

¿Cuáles son las mejores bibliotecas de redes neuronales de Python y Java con soporte multi gpu y multiplataforma?

¿Dónde está el mejor lugar para encontrar startups emergentes de aprendizaje automático y PNL?

¿Cuáles son las ventajas y desventajas de utilizar PMML como formato de intercambio para modelos de análisis predictivo?

¿Cuán relevantes son las redes neuronales atractoras en la investigación actual del aprendizaje automático?

¿Qué son las redes neuronales, redes neuronales artificiales y redes neuronales convolucionales? ¿Cómo son diferentes el uno del otro?

¿Hay un grupo de investigadores trabajando en la síntesis de texto EEG (conversión de pensamiento a texto)?

Cómo visualizar características de alto nivel en una red neuronal convolucional profunda

Cómo construir un sistema de aprendizaje automático para la revisión automática de código

¿Cuál es la mejor manera de crear un conjunto de redes neuronales?

¿Podemos combinar HOG y PCA en la clasificación de imágenes?

¿Somos mejores que las máquinas que creamos?

¿Cuáles son las probabilidades de ingresar a un programa de posgrado de aprendizaje automático en una escuela superior si mi experiencia en investigación es en bioinformática y algo de experiencia en investigación en PNL?

Web Analytics