No estoy seguro de si este es el tipo de respuesta que estás buscando, pero:
Realmente, este algoritmo está tratando de explicar los datos observados como el resultado de una verdad oculta, más simple y subyacente. Los datos observados son en realidad irregulares, ruidosos y difíciles de explicar exactamente. El proceso que lo creó probablemente sea relativamente consistente y simple, incluso si ‘discrepa’ un poco con los datos observados.
Tal vez me veas escuchar a Pantera, Megadeth y algo de Mozart. Estas observaciones son difíciles de explicar: esta última es muy diferente. ¿Tal vez lo último es solo ruido, un error? y la verdad es que solo me gusta el metal. Tal vez escucho todo tipo de música, desde metal hasta rock, progresivo, sinfónico o clásico. Mi gusto total parece coherente, pero esta pequeña visión no es simple.
- Cómo crear mi propio algoritmo de compresión básico para archivos
- ¿Cuánto tiempo lleva aprender el algoritmo?
- Cómo entender algoritmos en lenguajes de programación
- Cómo comprar un algoritmo de creación de mercado para acciones
- Cómo comparar dos algoritmos de recomendación en términos de problema de cola larga
Es por eso que tiene sentido buscar un modelo que solo se aproxime a la entrada observada en lugar de ajustarse exactamente. La verdad general y más simple que se ajusta principalmente a los datos observados tiene una mejor oportunidad de generalizar, de predecir correctamente interacciones no observadas.
No estoy seguro de tener un gran ejemplo intuitivo, pero supongamos que observa los números en los edificios mientras camina por la calle. Los números son 71, 73, 75, 76, 77, 81. ¿Cuál será el próximo número de edificio? Probablemente 83, porque es una apuesta bastante buena que los números de construcción están, en general, aumentando en 2. Ese es el patrón subyacente. Hay una excepción y un número faltante, pero parecen variaciones incidentales.
Lo bueno de este modelo de números es que puede completar espacios en blanco como el siguiente. La alternativa es explicar que los datos no tienen patrón, o patrones más complejos (71 a 75 por 2s, luego 76, luego 77 a 81 por 4s), lo que puede no sugerir ninguna extrapolación plausible a valores invisibles.