La construcción de modelos performantes es una espiral continua hacia la mejora del rendimiento de predicción que implica volver a visitar todos los pasos que condujeron al resultado:
- ordenar los datos y comprender los datos
- investigar a los alumnos que son aplicables a los tipos de datos
- dividir datos en trenes y conjuntos de prueba: asegúrese de tener una división representativa (barajado, estratificación, etc.)
- si es necesario, asegúrese de realizar la normalización de datos después de la división en cada conjunto de datos; hacer esto antes de la división induciría información del conjunto de trenes al conjunto de prueba y viceversa
- no toque el equipo de prueba bajo ninguna circunstancia
- si tiene suficientes datos, divida su conjunto de trenes en conjuntos de trenes y validación (plegado en k); si no, use la técnica de vivir uno afuera
- cree y valide de forma cruzada sus modelos utilizando el conjunto de datos del tren. Seleccione el modelo (s) que desea probar
- Si el ajuste del entrenamiento es consistentemente malo, puede que no haya datos lo suficientemente buenos o adecuados para la tarea: tamaño, calidad del predictor, linealidad, etc. Comprenda los datos (¡otra vez!), busque patrones, separe los datos, kernelize, diseñe nuevas características, etc.
- si el ajuste de aprendizaje es demasiado bueno, espere sorpresas desagradables en el conjunto de prueba (varianza – compensación de sesgo).
¡Espero que esto responda parcialmente la pregunta!
- ¿Cuál es la mejor manera de estudiar la estructura de datos de árbol?
- Cómo aprender 'algoritmos' sobre los que el mundo tecnológico está hablando y aplicarlos a mi vida cotidiana
- ¿Existe un algoritmo para encontrar un árbol con una longitud de ruta mínima ponderada para un gráfico conectado genérico?
- ¿Cuál es el número mínimo y máximo de materias que ofrece un estudiante en una escuela secundaria estadounidense?
- ¿Contamos la estructura original dada mientras contamos el número total de isómeros?