Dadas las variables / parámetros continuos, ¿cuál es la diferencia entre el aprendizaje automático y la interpolación?

A2A.
No creo entender la premisa de esta pregunta, sin embargo …

En algunas situaciones, las técnicas de interpolación pueden usarse como modelos de aprendizaje automático (por ejemplo, regresión y ajuste de curvas). Pero hay una amplia gama de métodos de aprendizaje automático que son mucho más complejos y tienen aplicaciones más amplias.

Considere el escenario de que los datos de entrada son bidimensionales y tenemos un problema de predicción a mano, entonces uno puede intentar ajustar una curva (interpolación) a través de estos datos. Luego tiene un modelo inmediato, que es asignar a cualquier punto de prueba el valor correspondiente en la curva. Esto es lo mismo que interpolación + extrapolación.
Otro modelo puede basarse en el algoritmo vecino más cercano, que asigna a cada punto de prueba el valor igual a la salida de su vecino más cercano (aquí también hay muchas opciones basadas en la métrica que elija). Una generalización consiste en elegir k vecinos más cercanos (k / a KNN en literatura de aprendizaje automático) y asignar un valor igual al promedio de los valores para estos k puntos.
Otro modelo (SVM) podría ser tratar la curva como la separación de los puntos de datos y asignar valor a un punto de prueba en función de si está por encima o por debajo de la curva. Una generalización es asignar los datos a un espacio dimensional más alto (llamado truco de Kernel) y luego construir una curva que separe los datos. Por supuesto que me estoy escondiendo mucho debajo del capó.
Otra opción sería agrupar los datos utilizando la agrupación de K-means.
Por supuesto, uno puede intentar proyectar los datos en un espacio dimensional inferior (utilizando PCA, SVD, etc.) y ver si los datos tienen clústeres.
También hay métodos como árboles de decisión, bosques aleatorios, aumento de gradiente, redes neuronales, redes bayesianas, modelos ocultos de Markov, etc. que se pueden aplicar para resolver el problema.
Finalmente, hay modelos bayesianos donde se asigna el valor de salida [math] y [/ math] a un punto de prueba [math] x [/ math] se asigna en función de cuál es el problema [math] (y | x) [/ matemática] que se puede calcular utilizando el teorema de Bayes en términos de [math] prob (x | y) [/ math].

Para poner todo en perspectiva, depende de su definición de interpolación.
En el corazón de la mayoría de los algoritmos de aprendizaje automático hay una función (que es imposible de encontrar):
[matemáticas] f: X \ flecha derecha Y [/ matemáticas]
donde [matemática] X [/ matemática] es el espacio de entrada e [matemática] Y [/ matemática] es el espacio de salida. Conocemos los valores de la función para algunos valores de puntos de entrada y queremos calcular los valores para otro posible. Entonces, tal vez puedas llamar a esto interpolación y extrapolación. Pero el diablo está en los detalles.

Y, por último, no creo que esto tenga nada que ver con que los atributos sean continuos.

Tengo entendido que el aprendizaje automático es una generalización: la interpolación es un caso especial de aproximación de funciones, tiene un conjunto de datos, desea saber si existe una función que pueda ‘explicar’ esos datos. Para hacer esto, utiliza herramientas como minimización de mínimos cuadrados, b-splines, etc.

Bueno, la minimización de mínimos cuadrados es la base de muchos algoritmos de aprendizaje automático y hay redes neuronales B-Spline que, si no me equivoco, se aproximan al conjunto de datos aprendiendo los parámetros de un B-Spline. Así que imagino que es seguro decir que la interpolación es un “subconjunto”, un caso especial de aprendizaje automático.

More Interesting

¿Cuáles son los criterios principales para la inicialización de los pesos en el aprendizaje profundo? Si quiero diseñar un algoritmo para la inicialización del peso, ¿qué factores debo tener en cuenta?

¿Cuáles son los requisitos previos para aprender Machine Learning?

¿Cuál es una buena puntuación porcentual en los problemas de conocimiento de Kaggle para principiantes?

¿Qué es un perceptrón?

¿Qué es un buen texto introductorio de aprendizaje automático?

¿Por qué el gradiente en el punto mínimo no es igual a 0?

¿Cómo soluciona un máximo A posterior el problema de sobreajuste en una estimación de máxima verosimilitud?

¿Cómo se implementa el aprendizaje profundo en Amazon Go (tiendas de comestibles especiales en las que recoges lo que quieras y luego te vas sin esperar a pagar)?

¿Cuáles son los roles de probabilidad y estadística en el aprendizaje automático? ¿Qué tan importantes son? ¿Cuáles son sus aplicaciones en el aprendizaje automático?

¿Puede el aprendizaje automático ayudarnos a comprender el cerebro humano?

¿Cómo funcionan los RBM? ¿Cuáles son algunos buenos casos de uso y algunos buenos artículos recientes sobre el tema?

¿Por qué las tasas de aceptación de las conferencias de minería de datos son tan bajas y qué tipo de documentos se rechazan?

¿Cuáles son los mejores laboratorios de investigación en el campo de los UAV combinados con aprendizaje automático, visión y percepción por computadora?

¿Es el análisis de sentimientos todo sobre lingüística?

En la extracción de relaciones (PNL), ¿cuál es la diferencia entre la extracción de relaciones supervisada, semi-supervisada y no supervisada?