El nuevo muestreo es una serie de métodos utilizados para reconstruir sus conjuntos de datos de muestra, incluidos los conjuntos de capacitación y los conjuntos de validación. Puede proporcionar conjuntos de muestras diferentes más “útiles” para el proceso de aprendizaje de alguna manera.
Por ejemplo, en Algoritmo de bosque aleatorio, podemos suponer que solo tenemos un conjunto de entrenamiento [math] \ cal {D} [/ math] con [math] N [/ math] muestras en él, y ahora necesitamos construir [ árboles de decisión de matemática] T [/ matemática] iterando el proceso de aprendizaje por [matemática] T [/ matemática] veces. Para cada iteración, el conjunto de entrenamiento debe ser diferente, de lo contrario, se producirán [math] T [/ math] árboles de decisión idénticos. En ese momento, se puede aplicar el método Bootstrap (un tipo de método de remuestreo), en el que las muestras [matemáticas] N ‘[/ matemáticas] (puede haber algunas idénticas) se seleccionan aleatoriamente de las [matemáticas] N [/ matemáticas]. Entonces podemos obtener [math] T [/ math] diferentes árboles de decisión, la función de clasificación final es la agregación de estos árboles. La agregación de diferentes árboles que aprenden de conjuntos de entrenamiento de muestreo por separado puede lograr una mayor precisión y evitar el sobreajuste en cierta medida.
Por supuesto, el ejemplo anterior es solo una aplicación típica de re-muestreo. El método de remuestreo también se puede utilizar para la validación y tener otros métodos de implementación. En resumen, proporciona suficientes datos que necesitamos y mantiene los datos confiables al mismo tiempo.
- ¿Funcionaría la búsqueda de 'colocaciones' de orden superior?
- Cómo justificar el rendimiento de un modelo de aprendizaje profundo personalizado (CNN)
- Estoy tratando de construir un proyecto de aprendizaje automático para predecir el precio del automóvil usado. ¿Dónde puedo obtener una base de datos para la reventa de los autos usados?
- ¿Por qué los modelos de aprendizaje automático no funcionan bien cuando se usan en la predicción del mercado de valores en vivo, pero, por otro lado, funcionan muy bien sin conexión?
- ¿Crees que es posible generar historias, pistas dadas, usando técnicas de PNL?