¿Por qué se hace referencia a la validación como ‘dev’ en algunos ejemplos de programas de aprendizaje automático?

En general, hay tres fases para el aprendizaje automático:

1) Capacitación, donde el modelo se ajusta a los datos primarios de capacitación.

2) Validación, donde el modelo está optimizado, utilizando un segundo conjunto de datos de entrenamiento.

3) Pruebas, donde el modelo final se evalúa utilizando datos de prueba.

Las fases 1 y 2 son parte del proceso de aprendizaje (fase de desarrollo, por lo tanto, “desarrollo”), donde el modelo cambia y mejora. En la fase 3, el aprendizaje y el desarrollo han terminado; El modelo no cambia durante las pruebas.

Sospecho que el uso del término ‘validación’ en el aprendizaje automático proviene de la validez de las estadísticas (estadísticas): Wikipedia, donde no es un término estricto, pero todavía surge a veces (por ejemplo, ‘validación cruzada’ se refiere a datos de partición de datos para las fases de tren y prueba) . En mi humilde opinión, el campo de ML ha cooptado el término “validación” de forma ambigua y disfuncional. Con suerte, la palabra caerá en desgracia y desaparecerá a medida que el ML madure.

Idealmente, ‘entrenar’ se referirá a la evaluación del modelo usando solo datos de entrenamiento, y ‘evaluar’ a la evaluación usando solo datos de prueba. Luego, durante la fase de entrenamiento 2, el refinamiento del modelo, en lugar de ‘validar’, usaría alguna variación en la palabra ‘entrenar’ (o tal vez ‘refinar’), minimizando así la ambigüedad.

Los entornos de desarrollo generalmente se dividen así, especialmente en lugares más grandes:

“Prod” – Producción. Donde reside el código y los datos reales.

“Puesta en escena”: servidor de puesta en escena. Una vez que todas las características son correctas, se implementa aquí para realizar pruebas de estrés.

“Prueba”: servidor de prueba. Los equipos de control de calidad generalmente ejecutan sus pruebas de características / regresión aquí.

“Dev” – Desarrollo – El lugar donde las personas ponen el corte inicial del código, después de que todas las pruebas unitarias pasan. Para pruebas de integración.

“Local”: estación de trabajo del desarrollador.

More Interesting

¿Cuál es el error de la bolsa en bosques aleatorios? Qué significa eso? ¿Cuál es un valor típico, si lo hay? ¿Por qué sería mayor o menor que un valor típico?

¿Qué algoritmo de aprendizaje automático debo usar cuando tengo 5-6 valores categóricos independientes y 1 variable continua dependiente?

Cómo saber qué algoritmo usar y cuándo

¿Qué significa 'Bagging reduce la varianza mientras se conserva el sesgo'?

Quiero comenzar en PNL. ¿Vale la pena?

¿Cuáles son los propósitos de ganchos y andamios en TensorFlow?

¿Cuál es el mejor curso en línea para el aprendizaje automático con Python?

¿Cuál es la mejor manera de encontrar análisis de sentimientos?

Cómo crear la línea de regresión de mínimos cuadrados (error cuadrático medio mínimo) en R

¿Qué es el mecanizado en caliente?

¿Por qué el clasificador Bayes Network funciona tan bien como SVM con menos funciones que las que se usan con SVM?

¿Cómo podemos "entrenar" sistemáticamente los algoritmos de agrupación sobre qué combinaciones de atributos / características generan en última instancia los tipos deseados de agrupaciones?

En el análisis de sentimientos, ¿cómo son útiles los datos etiquetados por humanos para extraer características y capacitar a los clasificadores en el enfoque de aprendizaje automático?

Cómo preprocesar el conjunto de datos de correo electrónico de Enron

¿Cuál es el propósito de visualizar las capas de activación en una arquitectura de red neuronal convolucional?