En las tareas de recuperación de información o competencias de aprendizaje automático, he oído hablar de trenes y conjuntos de pruebas, pero ¿cuál es el “conjunto de prueba”?

En SemEval, los datos de prueba suelen ser pequeños, ejemplos de conjuntos de datos destinados a ayudar a los participantes a saber cómo se ve la estructura o el formato de los datos, permitiéndoles construir y probar sus flujos. Para las tareas de clasificación, esto también ayuda a los participantes a familiarizarse con las etiquetas y el esquema de anotación.

A menudo, esto se publica antes de los datos de entrenamiento, y en muchos casos es demasiado pequeño para el entrenamiento o la validación del sistema. En cambio, piense en esto como un conjunto de datos para resolver toda la infraestructura del sistema, como el preprocesamiento de datos y la extracción de características.

Una vez que se publican los datos de capacitación, algunas personas tratan los datos de prueba como un conjunto de pruebas, pero dependiendo de cómo los organizadores recopilaron y anotaron los datos, los datos de prueba ya pueden estar incluidos en los datos de capacitación. Por lo tanto, no daría una buena medida de generalización en datos no vistos.

El conjunto de prueba probablemente significa “conjunto de verificación”. Es como otro conjunto de prueba en el que verifica de antemano si su algoritmo funciona / tiene sentido / es consistente, antes de calcular un resultado e informar y precisión con su conjunto de prueba.

Esta respuesta más detallada se puede ver en StackOverflow: ¿cuál es la diferencia entre tren, validación y prueba en redes neuronales?

More Interesting

¿Hay algún papel de JavaScript en el aprendizaje automático o el desarrollo de IA?

¿Cuánto afecta, si es que lo hace, la calidad del archivo fuente a la salida de un códec, suponiendo que el primero sea mayor?

¿Cuáles son las historias de fracaso más grandes con respecto a las colocaciones en la universidad que has encontrado?

¿Cómo se utilizan los modelos de aprendizaje automático en datos con una escala media como 10 a 15 GB? ¿Alguien puede compartir el recurso para eso?

¿Cómo explicarías la diferencia entre el aprendizaje automático y el aprendizaje profundo a un niño de 13 años?

¿Cómo describirías la evolución de la inteligencia artificial programada en los videojuegos desde su lanzamiento hasta hoy?

Cómo cambiar una identificación de computadora

¿Por qué la mayoría de la gente todavía piensa que nuestro proceso de "pensamiento" es inherentemente diferente al de una computadora?

¿Por qué elegir la estructura de datos incorrecta hace que un programa sea ineficiente?

¿Cuál es una buena idea para una muestra de código de rieles para la posición de nivel de entrada?

¿Se está haciendo algún trabajo para que la IA pueda animar o interpretar artísticamente información o libros?

Si quiero escribir un compilador y hacer rodar a mano mi propio lexer / parser (sin lex / yacc o antlr), ¿cuál es el enfoque más fácil?

¿Es posible generalizar el algoritmo K-Means para cualquier espacio métrico?

¿Qué industrias serán las últimas en utilizar el aprendizaje automático?

¿Cómo se usa el aprendizaje automático en el arte multimedia?