Intuitivamente miraría 3 cosas en orden
- conjunto de datos: ¿cuál es la relación características / dimensión? ¿Qué tan grandes son los diferentes conjuntos en relación con las características? Por debajo de cierto nivel de p / n, las medidas de rendimiento no tienen sentido matemático.
- modelo: ¿qué tan flexible es? Demasiados cuadráticos y otros pueden ser contraproducentes. ¿La preparación de datos se realizó correctamente (especialmente si tiene flexibilidad)? ¿Tienes características redundantes? Colinealidad? ¿Sospecha de sinergias (x3 es solo un regresor o mosty debido a x2), etc.
- no está del todo claro cómo está configurado tu CV. Quizás no leí bien la pregunta. Supongo que creó el 10 veces en todo el conjunto cada vez, creando diferentes mezclas de variación entre el entrenamiento y la prueba.
Si no, es posible que desee hacer eso, y ejecutar nuevos modelos en el CV, vea cómo se comparan.
- ¿Qué título debo tomar para entrar en la investigación de Deep Learning? (Graduado de CS)
- ¿En qué casos las redes convolucionales no son una buena opción para la clasificación de imágenes?
- ¿Cuál es la diferencia entre la agrupación de texto y la clasificación de texto?
- ¿Cómo se usa el cálculo vectorial en el aprendizaje automático?
- ¿Cómo se relaciona el error cuadrático medio (RMSE) y la clasificación?