¿Por qué se hace referencia a la validación como ‘dev’ en algunos ejemplos de programas de aprendizaje automático?

En general, hay tres fases para el aprendizaje automático:

1) Capacitación, donde el modelo se ajusta a los datos primarios de capacitación.

2) Validación, donde el modelo está optimizado, utilizando un segundo conjunto de datos de entrenamiento.

¿Es c # una buena opción para el aprendizaje automático de producción?
¿Cuáles son algunas posibles aplicaciones de aprendizaje profundo que son bastante novedosas?
¿Cómo se explica el aprendizaje automático y la inteligencia artificial a un niño de 5 años?
¿Cuál es la diferencia entre neurociencia, neurobiología, neuroingeniería y neuropsicología?
¿Cuál es el mejor marco de aprendizaje profundo que puedo usar para clasificar las imágenes de resonancia magnética? ¿Keras es adecuado para eso?

3) Pruebas, donde el modelo final se evalúa utilizando datos de prueba.

Las fases 1 y 2 son parte del proceso de aprendizaje (fase de desarrollo, por lo tanto, “desarrollo”), donde el modelo cambia y mejora. En la fase 3, el aprendizaje y el desarrollo han terminado; El modelo no cambia durante las pruebas.

Sospecho que el uso del término ‘validación’ en el aprendizaje automático proviene de la validez de las estadísticas (estadísticas): Wikipedia, donde no es un término estricto, pero todavía surge a veces (por ejemplo, ‘validación cruzada’ se refiere a datos de partición de datos para las fases de tren y prueba) . En mi humilde opinión, el campo de ML ha cooptado el término “validación” de forma ambigua y disfuncional. Con suerte, la palabra caerá en desgracia y desaparecerá a medida que el ML madure.

Idealmente, ‘entrenar’ se referirá a la evaluación del modelo usando solo datos de entrenamiento, y ‘evaluar’ a la evaluación usando solo datos de prueba. Luego, durante la fase de entrenamiento 2, el refinamiento del modelo, en lugar de ‘validar’, usaría alguna variación en la palabra ‘entrenar’ (o tal vez ‘refinar’), minimizando así la ambigüedad.

Aprendizaje automáticoLenguajes de programaciónProgramación informática

Related Content

¿Cuáles son las diferencias entre Apache Spark y el Tensor Flow de Google?

¿Es Cortana de Microsoft una copia flagrante de Siri de Apple?

¿Qué algoritmo de recomendaciones es más efectivo para desarrollar un entorno de crowdsourcing y qué lenguaje de programación sugiere?

¿Por qué utilizamos el agrupamiento en el análisis estadístico? ¿Puedes dar una explicación intuitiva o ejemplos intuitivos?

¿Cuál es la función de las máquinas restringidas de Boltzmann para el filtrado colaborativo?

¿Puede la inteligencia artificial hacerse cargo de los trabajos humanos?

¿Es posible que una aplicación de aprendizaje automático que ejecute el mismo algoritmo y se alimente con los mismos datos para aprender cosas diferentes en pruebas de entrenamiento separadas?

Los entornos de desarrollo generalmente se dividen así, especialmente en lugares más grandes:

“Prod” – Producción. Donde reside el código y los datos reales.

“Puesta en escena”: servidor de puesta en escena. Una vez que todas las características son correctas, se implementa aquí para realizar pruebas de estrés.

“Prueba”: servidor de prueba. Los equipos de control de calidad generalmente ejecutan sus pruebas de características / regresión aquí.

“Dev” – Desarrollo – El lugar donde las personas ponen el corte inicial del código, después de que todas las pruebas unitarias pasan. Para pruebas de integración.

“Local”: estación de trabajo del desarrollador.

Randy Crawford

More Interesting

¿Cuál es el error de la bolsa en bosques aleatorios? Qué significa eso? ¿Cuál es un valor típico, si lo hay? ¿Por qué sería mayor o menor que un valor típico?

¿Qué algoritmo de aprendizaje automático debo usar cuando tengo 5-6 valores categóricos independientes y 1 variable continua dependiente?

Cómo saber qué algoritmo usar y cuándo

¿Qué significa 'Bagging reduce la varianza mientras se conserva el sesgo'?

Quiero comenzar en PNL. ¿Vale la pena?

¿Cuáles son los propósitos de ganchos y andamios en TensorFlow?

¿Cuál es el mejor curso en línea para el aprendizaje automático con Python?

¿Cuál es la mejor manera de encontrar análisis de sentimientos?

Cómo crear la línea de regresión de mínimos cuadrados (error cuadrático medio mínimo) en R

¿Qué es el mecanizado en caliente?

¿Por qué el clasificador Bayes Network funciona tan bien como SVM con menos funciones que las que se usan con SVM?

¿Cómo podemos "entrenar" sistemáticamente los algoritmos de agrupación sobre qué combinaciones de atributos / características generan en última instancia los tipos deseados de agrupaciones?

En el análisis de sentimientos, ¿cómo son útiles los datos etiquetados por humanos para extraer características y capacitar a los clasificadores en el enfoque de aprendizaje automático?

Cómo preprocesar el conjunto de datos de correo electrónico de Enron

¿Cuál es el propósito de visualizar las capas de activación en una arquitectura de red neuronal convolucional?

Web Analytics