El término “no paramétrico” puede sonar un poco confuso al principio: ¡no paramétrico no significa que NO tengan parámetros! Por el contrario, los modelos no paramétricos (pueden) se vuelven cada vez más complejos con una cantidad creciente de datos.
Entonces, en un modelo paramétrico, tenemos un número finito de parámetros, y en modelos no paramétricos, el número de parámetros es (potencialmente) infinito. O, en otras palabras, en modelos no paramétricos, la complejidad del modelo crece con el número de datos de entrenamiento; En los modelos paramétricos, tenemos un número fijo de parámetros (o una estructura fija si lo desea).
Los modelos lineales como la regresión lineal, la regresión logística y las máquinas de vectores de soporte lineales son ejemplos típicos de un “alumno” paramétrico; aquí, tenemos un tamaño fijo de parámetros (el coeficiente de peso). En contraste, K-vecino más cercano, árboles de decisión , o los SVM de kernel RBF se consideran algoritmos de aprendizaje no paramétricos, ya que el número de parámetros aumenta con el tamaño del conjunto de entrenamiento. – K-vecino más cercano y árboles de decisión, eso tiene sentido, pero ¿por qué un kernel RBF SVM no es paramétrico mientras que un SVM lineal es paramétrico? En el SVM del núcleo RBF, construimos la matriz del núcleo calculando las distancias por pares entre los puntos de entrenamiento, lo que lo hace no paramétrico.
- ¿Cuáles son los algoritmos / documentos de última generación sobre clasificación y recuperación de imágenes?
- ¿Qué matemáticas se necesitan para este curso de aprendizaje automático?
- En la clasificación automática de documentos, ¿cómo trato con categorías en conflicto?
- ¿Se pueden mapear los datos de entrada circulares (como la fase de una sinusoide) en un espacio de características lineales usando un núcleo lineal usando SVM? Si no, ¿qué núcleo es óptimo para datos de entrada circulares?
- ¿Qué es el aprendizaje automático y sus diferencias con la inteligencia artificial?
En el campo de las estadísticas, el término paramétrico también se asocia con una distribución de probabilidad específica que “asume” que siguen sus datos, y esta distribución viene con el número finito de parámetros (por ejemplo, la media y la desviación estándar de una distribución normal) ; no hace / tiene estos supuestos en modelos no paramétricos. Entonces, en términos intuitivos, podemos pensar en un modelo no paramétrico como un modelo de “distribución” o (casi) sin suposición.
Sin embargo, tenga en cuenta que las definiciones de “paramétrico” y “no paramétrico” son “un poco ambiguas” en el mejor de los casos; de acuerdo con el “Manual de estadísticas no paramétricas 1 (1962) en la pág. 2: “Una definición precisa y universalmente aceptable del término ‘no paramétrico’ actualmente no está disponible. El punto de vista adoptado en este manual es que un procedimiento estadístico es de tipo no paramétrico si tiene propiedades que se satisfacen con una aproximación razonable cuando se mantienen algunas suposiciones que son al menos de naturaleza moderadamente general “.