Esta es una optimización basada en un modelo sustituto. El término se refiere a modelos de un sistema que es lo suficientemente rápido y simple como para que pueda ajustar sus entradas para optimizar la salida.
Este puede ser un modelo de caja negra construido a partir de datos del mundo real. Típicamente imitará las correlaciones y las propiedades estadísticas del sistema del mundo real, similar a la producción de datos sustitutos.
Probablemente haya utilizado el principio del modelo sustituto en algún momento. La siguiente figura muestra una colección de puntos de datos y un ajuste de curva. Si alguien le pregunta qué x seleccionar para minimizar y, simplemente mire la curva y diga “configure x aproximadamente 2.2”. Esa curva es su modelo sustituto del sistema que produjo esos puntos de datos. Lo construyó utilizando un “enfoque de abajo hacia arriba basado en datos”, lo que significa que utilizó los datos disponibles, no su conocimiento de lo que haya generado esos datos. 🙂
- ¿Cómo definirías y medirías el poder predictivo de una métrica?
- ¿Cómo afectaría exactamente la falta de experiencia en programación Java a la competencia de uno en Hadoop y su pila de tecnología?
- Cómo crear una aplicación sin conocimiento de la ciencia de datos, de modo que pueda analizar puntos de datos en retrospectiva
- ¿Debería unirme a 'dominar el análisis de datos con R' por edureka o 'Análisis de datos con R' por Udacity?
- ¿Los científicos de datos usan programación orientada a objetos?
Un ejemplo práctico de un modelo sustituto sería tratar de optimizar el rendimiento de algún proceso químico en una planta de producción. En lugar de hacer un simulador de toda la planta y gastar años de CPU tratando de optimizar sus entradas para producir los rendimientos más altos posibles, se pueden recopilar puntos de datos de la planta de producción del mundo real en diversas condiciones. Estos podrían analizarse, por ejemplo, con el Análisis de componentes principales (PCA), que producirá una relación aproximada simple entre las variables de control y la salida. Luego puede usar esta relación para maximizar el rendimiento de la planta.