¿Es la red neuronal para la clasificación en un problema esencial de ajuste de línea o problema de agrupamiento?

Una red neuronal

Una red neuronal aplica el modelo de clasificación. Se encuentra bajo el paradigma de aprendizaje supervisado . Toma datos de algún tipo, generalmente preprocesados ​​o elegidos por el experto del dominio. También toma la respuesta o evaluación conocida. Luego ajusta los datos a la respuesta, con una serie de transformaciones conocidas como capas y empleando otra función llamada propagación inversa . Luego realiza una predicción, con el criterio de minimizar el error entre la predicción y la respuesta conocida . De esta manera, el modelo ajustado se puede volver a aplicar a datos del mismo tipo, pero con nuevas observaciones o valores, y hacer predicciones sin ninguna evaluación conocida .

Ajuste de línea o agrupamiento

Un problema de regresión y una solución se ocupa de un modelo lineal. Simplemente aparece como una línea en 2 dimensiones, pero se resume en dimensiones más altas usando álgebra matricial. La solución al problema en 2 dimensiones tiene un coeficiente y una intersección. Pero la solución al problema en p dimensiones, con p> 2, tiene coeficientes p-1 y una intersección. Podemos llamar a la regresión lineal en 2 dimensiones la solución de línea, y la regresión lineal en p dimensiones la solución de hiperlínea.

Un problema de agrupamiento puede tratar con altas dimensiones, p, y aplicar álgebra matricial. Se ocupa de cada dimensión en coordenadas, y acumula observaciones en todas las coordenadas. Esto aplica un espacio vectorial en las dimensiones p, e inmediatamente sugiere que cada observación se coloca como un punto. Luego, cada punto se agrupa con los puntos cercanos, centrados en k grupos y k medios. El algoritmo aplica iteraciones para reunir cada punto a la media cercana y luego vuelve a calcular la media para todos los puntos. El final devuelve k grupos con los puntos cercanos, esencialmente agrupando observaciones.

Evaluación

La red neuronal comúnmente aplica un modelo predictivo similar al problema de regresión lineal, y no extrae ninguna estructura o agrupación del conjunto de datos. Si la serie de transformaciones, capas y funciones, propagación hacia atrás , se rastrean y se almacenan sus datos, entonces el proceso puede extraer alguna estructura .

Entre los dos, está más cerca de la regresión, pero tampoco lo están las descripciones completas del aprendizaje profundo. Nuevos descubrimientos sobre gradientes durante el entrenamiento sugieren que las redes profundas no están haciendo una simple optimización a través de SGD.