Al entrenar y probar conjuntos de datos, ¿es posible probar un conjunto de datos completamente diferente del conjunto de entrenamiento?

Una forma de abordar este problema es si puede encontrar un subconjunto de los datos de entrenamiento que sigue cerca de la misma distribución que los datos de su prueba. Usted ve este problema en la comunicación aumentativa alternativa (AAC), donde no existe un corpus de capacitación pública que realmente funcione. Vertanen y Kristensson generaron un pequeño conjunto de datos utilizando trabajadores mecánicos turcos que pensaron que sería similar al conjunto de datos de prueba, pero era demasiado pequeño para entrenar y obtener buenos resultados solo con eso. Luego usaron algunos métodos de teoría de la información para seleccionar oraciones de un conjunto de datos mucho más grande que eran similares al conjunto de datos turco, y usaron este subconjunto del conjunto de datos grandes para entrenar su modelo.

Otra cosa que puede hacer es que si su conjunto de datos de entrenamiento no es “completamente” diferente, por lo que es útil para predecir el conjunto de datos de prueba, pero no es ideal, utilice algún tipo de aprendizaje en línea para actualizar los parámetros con su conjunto de datos de prueba.

Análisis de datosAprendizaje automáticodatosMinería de datos

Related Content

Cómo predecir las ventas del próximo año, nivel de día, dada la información de ventas de años anteriores, también a nivel de día, y mediante el uso de Kalman Filtering

Diseño de vectores de características para algoritmos de aprendizaje automático. ¿Debo poner características de diferentes dominios en el mismo vector?

Cómo obtener la etiqueta del tema que modela la salida LDA

¿Cómo deciden los científicos computacionales qué estrategia usar para la validación cruzada?

¿Dónde puedo aprender el aprendizaje automático desde cero en C ++?

¿Cuánto tiempo se necesita para leer Introducción a Algoritmos de TH Cormen, para un principiante?

¿Es posible usar el servicio de reconocimiento facial de Facebook desde su API?

Su conjunto de prueba siempre debe estar separado (por lo tanto: completamente diferente) de su conjunto de entrenamiento.

Sin embargo, el conjunto de entrenamiento y el conjunto de prueba (cada uno por su cuenta y, por lo tanto, también juntos) deben representar los “datos reales” y especialmente la distribución lo mejor posible.

Martin Thoma

Bueno, depende de lo que quieras decir con completamente diferente. La mayoría de los modelos esperan que todos sus datos tengan la misma cantidad de características (idealmente deberían ser las MISMAS características).

Sin embargo, siempre que haya la misma cantidad de características, puede incluir los datos que desee. Simplemente no se sorprenda de obtener resultados aleatorios / horribles.

Si quiere decir algo como el mismo tipo de datos que pertenece a otro conjunto, entonces podría ser bueno validar su modelo para ver qué tan bien se generaliza. Pero si este es el caso, le sugiero que haga que su entrenamiento establezca una combinación de subconjuntos: uno de cada uno. Es más probable que esto produzca un mejor modelo.

Martin Thoma

La suposición de los modelos de entrenamiento y prueba usando una partición es que ambos conjuntos son representativos de la población. Si el conjunto de prueba es significativamente diferente del conjunto de entrenamiento, lo que está haciendo ahora se conoce como extrapolación.

Es decir, digamos que ajusta un polinomio a un grupo de puntos en el intervalo [matemáticas] [a, b] [/ matemáticas]. ¿Qué le dice esto realmente sobre lo que debe hacer el polinomio en los intervalos [matemáticas] (- \ infty, a) [/ matemáticas] y [matemáticas] (b, \ infty) [/ matemáticas]?

El rendimiento de extrapolación de un modelo depende en gran medida de las suposiciones hechas y, en general, es un problema muy difícil.

Skylar Payne

También puede probar un método de dejar uno afuera. Por ejemplo, si tiene 100 muestras, entrena con 99 muestras y prueba con la 1 muestra adicional. Repite esto 100 veces dejando un valor diferente. Puede extenderse a dejar algo.

Martin Thoma

More Interesting

Cómo hacer que una red neuronal funcione como PCA

¿Hay grupos de investigación trabajando en aprendizaje profundo teórico?

¿Las redes neuronales son siempre convexas con respecto a los pesos? Y si no, ¿cómo funciona tan bien el descenso de gradiente?

¿Existe algún modelo de aprendizaje profundo o algún otro método que ingrese como una colección de documentos y pueda predecir la probabilidad de un nuevo documento?

¿Cuál es un buen lugar para comenzar a trabajar en el uso del aprendizaje automático para el modelado de riesgo de crédito?

¿Cuáles son algunas aplicaciones potenciales del seguimiento de objetos depredadores (nuevo algoritmo)?

¿Cuándo debo usar un autoencoder frente a un RBM?

¿Cómo debo saber que estoy interesado en el aprendizaje automático?

¿Qué es una regresión logística condicional?

Cómo explicar las diferencias entre IBM Watson y Google DeepMind a personas no técnicas

Cómo usar mel-spectrogram como entrada de una CNN

En TensorFlow, ¿qué es una capa 'densa' y una 'abandonada'?

¿Qué son los núcleos de difusión?

¿Cuál es la principal diferencia entre la forma bayesiana de estimación de parámetros y la regresión lineal?

¿Es incorrecto si realizo un análisis de opinión en revisiones individuales en lugar de en todas las revisiones a la vez?

Web Analytics