¿Qué son los datos de prueba?

Entonces, supongamos que tiene un conjunto de datos para el que está creando un modelo de predicción de algún tipo. Por lo general, divide el conjunto de datos en datos de entrenamiento y prueba . Los datos de entrenamiento serán la mayoría de sus datos, ya que informarán los detalles de su modelo.

Una vez que haya entrenado adecuadamente su modelo y esté listo para la prueba, aquí es donde entran sus datos de prueba. Dicho esto, los datos de prueba son la parte de sus datos que deja para verificar qué tan bien está funcionando su modelo. Esto es independiente de sus datos de entrenamiento porque las pruebas en sus datos de entrenamiento siempre darán como resultado una precisión del 100% ya que predicen datos que ya se han visto. Esta es la razón por la cual los datos de prueba son tan importantes: ¡proporcionan información sobre qué tan bien (o no bien) está funcionando su modelo!

Suponga que está probando Quora.com. Puede crear datos como la Pregunta 1, la Respuesta 1, la Pregunta 2, la Respuesta 2 …

Una mejor manera de probar el sitio sería crear datos que representen cómo los usuarios crearían preguntas y respuestas en el sitio real. Eso no es fácil. Ese es el proceso de creación de datos de prueba.