En el aprendizaje supervisado, intentamos inferir la función de los datos de entrenamiento. Aquí hay algunas buenas respuestas sobre aprendizaje supervisado. Por lo tanto, no daré información técnica, sino que usaré mi analogía.
Hay tres pasos para construir un modelo supervisado. Modelo de construcción, modelo de tren y modelo de prueba.
Déjame darte mi analogía del aprendizaje supervisado. Supongamos que eres un estudiante y quieres aprender una materia llamada aprendizaje automático. Te has unido a una clase de enseñanza para el aprendizaje automático.
- ¿Qué distingue una capa de una red neuronal de otras capas?
- ¿Qué es el etiquetado gráfico?
- ¿La topografía emocional es relevante para IR?
- ¿Cómo funciona el mecanismo de atención de múltiples cabezas en el aprendizaje profundo?
- ¿Cuándo es PyTorch más útil en comparación con TensorFlow y viceversa?
1 – En este caso eres modelo. Así que ahora tenemos un modelo (perdón por esto :))
2 – Ahora tu profesor te enseñará el aprendizaje automático. Durante la enseñanza, su maestro puede usar algún recurso. En terminología de aprendizaje automático, este es el proceso de capacitación. Donde entrenamos nuestro modelo con datos pasados / actuales. El proceso de capacitación varía según el algoritmo de aprendizaje. En resumen, lo que hacemos es tratar de encontrar patrones en los datos.
3 – Al final del curso, tu profesor puede evaluar tus conocimientos para comprobar qué tan bien lo has hecho. Su maestro evaluará su conocimiento y, en función de eso, tomará algunas medidas para mejorarlo. Una situación a tener en cuenta aquí es que, durante la enseñanza, su maestro podría haber usado algunos ejemplos, por lo que obviamente no lo preguntará en la prueba. Si él pregunta ese ejemplo, entonces puedes resolverlo fácilmente ya que ya lo has aprendido. Su maestro realiza una prueba para asegurarse de que haya aprendido el concepto y que también pueda desempeñarse bien en nuevos ejemplos. En terminología de aprendizaje automático, dado que hemos entrenado nuestro modelo en datos de entrenamiento, funcionará bien (la mayoría de las veces) en los datos de entrenamiento. Para verificar su poder real de predicción o precisión, tenemos que probarlo en datos no vistos (datos de prueba). Por lo general, dividimos todo el conjunto de datos de manera 70:30 para formar datos de entrenamiento y prueba, respectivamente.
Ejemplo práctico, supongamos que está tratando de construir un modelo que pueda detectar transacciones fraudulentas de tarjetas de crédito. Lo que puede hacer es tratar de reunir la mayor cantidad de datos posible de incidentes pasados. Digamos que tiene 500 datos sobre transacciones fraudulentas y 500 datos sobre transacciones normales. Ahora puede utilizar cualquier algoritmo de aprendizaje supervisado que intentará encontrar patrones en los datos cuando se trate de una transacción fraudulenta y cuando sea una transacción normal. Entonces, ahora su modelo sabe cuándo existe un patrón xyz en los datos, entonces hay alguna probabilidad de que sea una transacción fraudulenta.
Espero que sea útil!