Un modelo paramétrico captura toda su información sobre los datos dentro de sus parámetros. Todo lo que necesita saber para predecir un valor de datos futuro a partir del estado actual del modelo son solo sus parámetros. Por ejemplo, en caso de una regresión lineal con una variable, tiene dos parámetros (el coeficiente y la intersección). Conocer estos dos parámetros le permitirá predecir un nuevo valor.
Por otro lado, un modelo no paramétrico puede capturar aspectos más sutiles de los datos. Permite que pase más información del conjunto actual de datos que se adjunta al modelo en el estado actual, para poder predecir cualquier dato futuro. Por lo general, se dice que los parámetros son infinitos en dimensiones y, por lo tanto, pueden expresar las características en los datos mucho mejor que los modelos paramétricos. Tiene más grados de libertad y es más flexible. Un modelo de mezcla gaussiana, por ejemplo, tiene más flexibilidad para expresar los datos en forma de distribuciones gaussianas múltiples. Haber observado más datos lo ayudará a hacer una predicción aún mejor sobre los datos futuros.
En resumen, piénselo de esta manera. Para que un modelo paramétrico prediga nuevos datos, conocer solo los parámetros es suficiente (piense en la regresión lineal basada en un conjunto de parámetros). Para un modelo no paramétrico, la predicción de datos futuros se basa no solo en los parámetros sino también en el estado actual de los datos que se han observado (piense en el modelado de temas que se basa en distribuciones de dirichlet latentes).
- ¿Cuánto costaría desarrollar la capacidad de reconocimiento de escritura a mano?
- ¿Cuáles son los principales problemas con el uso de la codificación one-hot?
- ¿Cuáles son algunos de los documentos fundamentales en el aprendizaje automático / algoritmos analíticos?
- Quiero aprender el procesamiento del lenguaje natural en CMU. ¿Es mejor tomarlo como un estudiante de CS o tomarlo como un estudiante de lingüística (como una electiva)?
- ¿Cómo se calcula la pérdida WARP de la estadística de orden K para aprender a clasificar las recomendaciones?