Supervisado versus no supervisado, inferencia versus predicción, paramétrico versus no paramétrico, ¿cómo se combinan esas características entre sí?

Solo para especificar un poco mi pregunta:

Me he encontrado con las definiciones de cada término (mi campo de estudio inicial es estadística), y he aplicado muchos modelos (lineal, splines, árbol, pca, gam, K significa …) pero en la práctica estoy teniendo un Es difícil vincular modelos con esos términos. Aquí está la forma (en muy pocas palabras) los entiendo:

Supervisado: modelización con salida clara identificada: y = f (x1, x2,….)

Sin supervisión: sin salida clara

Inferencia: interés en comprender la relación entre la variable y la relación con la salida => por lo que parece ser esencialmente el estudio de la característica de la función f (forma, rango, etc.). Lo que a su vez debería implicar una buena interpretabilidad del modelo, por lo que es más probable que se refiera al modelo lineal, ¿tengo razón?

Predicción: interés en predecir correctamente una salida (independientemente de la concideración de causalidad)

Paramétrico: la forma de la función f es asumida por la elección del modelo

No paramétrico: sin suposición sobre la función f (supuestamente desconocida)

Entonces parece que, por ejemplo, la agrupación con k-mean es un método no paramétrico no supervisado, ¿verdad? Sin embargo, la agrupación se trata de describir una observación de cantidad de repetición que parece una inferencia para mí, pero el modelo no proporciona una relación directamente interpretable, ¿verdad?

¿Puedes ver que estoy confundido ^^ tal vez es porque cuando pienso en inferencia, en mi mente imagino algo así como una elasticidad, que podría ser demasiado restrictiva para ilustrarla …

More Interesting

¿Cómo genera fastText un vector para una palabra que no está en el modelo pre-entrenado?

¿Cuáles son los pros y los contras de aprender ExpressJS?

¿Cambridge o Stanford / Berkeley son mejores en aprendizaje automático?

¿Es un doctorado en inteligencia artificial una cosa? ¿O el doctorado estaría realmente en aprendizaje automático / visión artificial, etc.?

¿Qué son los espacios latentes en el aprendizaje de representación?

¿Por qué la longitud desigual del texto es un problema en el procesamiento del lenguaje natural?

¿Qué carrera es mejor, Machine Learning o DevOps?

¿Qué prueba estadística usar para cuantificar la similitud entre dos distribuciones cuando no son normales?

¿Por qué utilizamos la política codiciosa de epsilon para la evaluación en el aprendizaje por refuerzo?

¿Hay alguna diferencia entre los codificadores automáticos y el codificador-decodificador en el aprendizaje profundo?

¿Pueden los métodos de aprendizaje profundo ser útiles para el seguimiento de múltiples objetos en una multitud?

¿Cuáles son algunos de los buenos libros sobre redes neuronales artificiales, minería de datos, aprendizaje automático, big data y análisis de datos?

¿Son los modelos gráficos probabilísticos comúnmente vistos / muy utilizados en la minería de datos práctica / cotidiana?

¿Cuántos tipos de técnicas utilizan los limpiadores profesionales?

Cómo numerar los clústeres en la agrupación jerárquica de documentos en Python