No entiendo su referencia a su padrastro, pero una función de costo es solo una forma de asignar un puntaje de prioridad a un modelo que ha desarrollado. Supongamos que tiene datos representados por pares de observaciones x (observadas) e y, y se le ocurre una función f (x) para predecir y dado x, es decir, y_predicted = f (x). Esta predicción podría provenir de un algoritmo de aprendizaje automático, o podría ser algo que su hermana pequeña inventó. No importa de dónde vino (por ahora).
Pero su predicción no siempre es igual al y_observado real que puede ver en la práctica. Una función de costo es una forma de medir esto: es una función de valor real c (y_predicted, y_actual) que mide la cantidad de penalización en la que incurriría si su predicción es incorrecta (o correcta). Algunas funciones comunes de costos incluyen:
| y_predicted – y_actual |
- ¿Por qué es tan difícil la IA? ¿Por qué todavía no hemos construido una máquina de IA?
- ¿Cómo se puede utilizar la máquina de Boltzmann restringida en problemas de clasificación?
- ¿Cuáles son las principales innovaciones y hallazgos del documento 'Diseño químico automático utilizando una representación continua de moléculas basada en datos'?
- Cómo lidiar con múltiples resultados mutuamente dependientes en el aprendizaje automático
- ¿Cuál es la pérdida latente en autoencoders variacionales?
(y_predicted – y_actual) ^ 2
1 si y_predicted! = Y_actual, 0 de lo contrario
Lo importante es esto: si puede definir su función de costo, junto con algunas otras suposiciones del modelo sobre cómo y_predicted proviene de x, puede ajustar el modelo para minimizar esa función de costo con herramientas bien establecidas. Esto es muy poderoso, porque le brinda mucha flexibilidad para definir su modelo f (x).
Los factores que a menudo entran en la decisión de una función de costo incluyen:
- La cantidad de beneficio o dolor que obtienes por predecir mal un determinado resultado cuando el resultado real es diferente, en función de una motivación económica (por ejemplo, cuánto dinero perderías por estar equivocado)
- Cuán conveniente es trabajar con modelos algebraicamente y ajustarse a los datos (la regresión de mínimos cuadrados es fácil de ajustar, por ejemplo)
- Los posibles valores que y_actual y y_predicted pueden tomar (por ejemplo, positivo, sin restricciones o en {0, 1}). Tenga en cuenta que y_actual y y_predicted no necesitan tomar los mismos valores. En algunos casos, y_actual está en {0, 1}, mientras que y_predicted está en [0, 1].
En algunos casos, las personas suponen que la función de costo también incluye términos adicionales para penalizar (es decir, regularizar) los pesos de ciertos parámetros del modelo. Esto puede ayudar a hacer que el modelo sea más robusto para el sobreajuste, y es otro factor:
4. Codificación de robustez en su modelo.