¿Qué es el remuestreo en el aprendizaje automático?

El nuevo muestreo es una serie de métodos utilizados para reconstruir sus conjuntos de datos de muestra, incluidos los conjuntos de capacitación y los conjuntos de validación. Puede proporcionar conjuntos de muestras diferentes más “útiles” para el proceso de aprendizaje de alguna manera.

Por ejemplo, en Algoritmo de bosque aleatorio, podemos suponer que solo tenemos un conjunto de entrenamiento [math] \ cal {D} [/ math] con [math] N [/ math] muestras en él, y ahora necesitamos construir [ árboles de decisión de matemática] T [/ matemática] iterando el proceso de aprendizaje por [matemática] T [/ matemática] veces. Para cada iteración, el conjunto de entrenamiento debe ser diferente, de lo contrario, se producirán [math] T [/ math] árboles de decisión idénticos. En ese momento, se puede aplicar el método Bootstrap (un tipo de método de remuestreo), en el que las muestras [matemáticas] N ‘[/ matemáticas] (puede haber algunas idénticas) se seleccionan aleatoriamente de las [matemáticas] N [/ matemáticas]. Entonces podemos obtener [math] T [/ math] diferentes árboles de decisión, la función de clasificación final es la agregación de estos árboles. La agregación de diferentes árboles que aprenden de conjuntos de entrenamiento de muestreo por separado puede lograr una mayor precisión y evitar el sobreajuste en cierta medida.

Por supuesto, el ejemplo anterior es solo una aplicación típica de re-muestreo. El método de remuestreo también se puede utilizar para la validación y tener otros métodos de implementación. En resumen, proporciona suficientes datos que necesitamos y mantiene los datos confiables al mismo tiempo.

Aprendizaje automáticoinformáticaInteligencia Artificial

Related Content

¿Cómo detectar el idioma de un texto escrito en inglés? ¿Hay una API disponible donde podamos dar el texto como entrada?

¿Cuál es la diferencia entre las pruebas de heterocedasticidad y las pruebas de normalidad de errores?

¿Cómo determina el reconocimiento facial al dueño de la cara que detecta?

Cómo pasar del desarrollo de pila completa al aprendizaje automático en el trabajo independiente

¿Existe alguna posibilidad de que la química del aprendizaje automático pueda correlacionarse con la nanotecnología?

¿Cuál es la regla de entrenamiento para redes de perceptrón de capa única con umbral?

Cómo revolucionar la robótica

Dividimos nuestros datos originales en conjuntos de entrenamiento y pruebas. Después de encontrar los coeficientes adecuados para el modelo con la ayuda del conjunto de entrenamiento, aplicamos ese modelo en el conjunto de prueba y encontramos la precisión del modelo. Esta es la precisión final antes de aplicarla a datos desconocidos. Y más es esta precisión final, mayor es la esperanza de obtener resultados precisos en datos desconocidos.

Sin embargo, si dividimos aún más el conjunto de entrenamiento en sus subconjuntos de entrenamiento y prueba y luego calculamos la precisión final de ese subconjunto y hacemos esto repetidamente para muchos subconjuntos, entonces elegimos los coeficientes (modelo) que nos dan la máxima precisión entre estos subconjuntos, y esperamos que este modelo dará la máxima precisión al conjunto de prueba final.

El remuestreo se realiza para mejorar la precisión del modelo.

Hay diferentes formas de volver a muestrear datos como bootstrapping, validación cruzada, validación cruzada repetida, etc.

Xinyi Li

More Interesting

¿Implementó algoritmos de aprendizaje automático desde cero con el propósito de aprender?

¿Puede la generación de características de fuerza bruta vencer a la ingeniería de características clásica?

Cómo usar Tensorflow para Python en Windows

Cómo hacer que una red neuronal funcione como PCA

¿Cuál es el tamaño mínimo de corpus para entrenar incrustaciones de palabras?

¿Son el aprendizaje automático / aprendizaje profundo / ciencia de datos, realmente ciencia espacial para que un tipo promedio entienda e implemente?

Como principiante, ¿cómo debo estudiar el aprendizaje profundo?

Cómo lidiar con un conjunto de datos duro que no me da buenos resultados en la validación del modelo

¿Cuál es la mejor herramienta de aprendizaje automático para Mac OS?

¿Por qué querríamos intentar aprender una base demasiado completa en codificación dispersa?

Tengo una oferta de Qualcomm y una oferta postdoc de CMU. Trabajo en visión artificial / aprendizaje automático. ¿Qué tengo que hacer?

¿Qué es una herramienta Weka?

¿Cuál es el algoritmo utilizado para mantener los drones equilibrados en el aire, a pesar de los golpes externos, como la ráfaga de viento?

¿Algún investigador utiliza ReLU en un modelo de aprendizaje no profundo? ¿ReLU es solo para aprendizaje profundo?

¿Cómo calcula Gensim.Word2vec la probabilidad de texto usando una puntuación de modelo?

Web Analytics