¿Qué significa la siguiente declaración: las redes neuronales son generalmente paramétricas y optimizadas para producir una estimación puntual?

Parece que el tipo que citó esto probablemente era un estadístico … en lugar de un programador. Necesitará ver esto desde una perspectiva diferente para entender esto. También estoy asumiendo una familiaridad básica con las redes neuronales, ya que esta pregunta se incluye en ese tema.

Los datos que está alimentando a la red neuronal => Muestra
Sus datos + Todos los datos invisibles posibles => Población

Estimación de puntos: Digamos que su población tiene pesos verdaderos W, X, Y, Z … (esto significa que una vez que haya dominado los pesos W, X, Y, Z, … podrá predecir algo con total precisión) . Como ya sabría en una red neuronal, comienza con algunos pesos iniciales w, x, y, z y espera acercarse tanto a W, X, Y, Z …

Su final w, x, y, z, … (después de entrenar en sus datos) que espera que esté realmente cerca de W, X, Y, Z, … es su estimación puntual de la estadística de población

Paramétrico: está asumiendo que la muestra proviene de una distribución de probabilidad. La consecuencia de la primera declaración es que puede expresar sus datos mediante algunos parámetros que conforman la distribución (por ejemplo, mu y sigma describen completamente cierta distribución normal). En nuestro caso, suponemos que los pesos de la red neuronal si se hacen correctamente pueden describir completamente la muestra. Esto es lo que llamas paramétrico

Optimización: Y para completar la respuesta (que ya sabrías), lo que haces para obtener w, x, y, z … lo más cercano a W, X, Y, Z … es la optimización.

Esos fueron mis dos centavos en esta pregunta, espero que si vuelves a subir y lees la oración críptica nuevamente podrás entenderla.

¿No? Deja un comentario sobre lo que te mantiene perplejo e intentaré refinar mi respuesta.

More Interesting

¿Por qué mi modelo de regresión produce valores negativos para SalePrice en los datos de prueba?

Cómo obtener todos los problemas de investigación en el aprendizaje por refuerzo

¿Cuándo debo usar la agrupación antes de ejecutar un modelo de regresión logística?

¿Qué tan difícil es para un estudiante de pregrado ser aceptado en un grupo de investigación en la universidad?

¿En qué medida se puede utilizar el aprendizaje automático y la IA en la detección y el tratamiento del cáncer?

En una explicación intuitiva, ¿cómo puedo calcular formas primarias y duales en SVM?

¿Cuándo puede el aprendizaje profundo ser una herramienta inadecuada para una empresa?

¿Qué tan similares son los problemas en los diversos campos del análisis de datos (aprendizaje automático, estadísticas, procesamiento de señales, optimización, teoría de la información, etc.)?

¿Qué tipos de trabajos están disponibles en la industria financiera para un máster en ML / AI graduado?

¿Cómo se usa la informática en su trabajo / campo?

¿Cómo escalas una red neuronal profunda para que se ejecute en un dispositivo móvil?

¿Qué algoritmo puedo implementar para hacer una reducción de dimensión con restricción no negativa? (PCA se asignará al espacio negativo)

Yoshua Bengio: ¿Será el aprendizaje profundo un paso hacia la IA consciente?

¿Por qué se utiliza un descenso gradiente iterativo para redes neuronales y no inmediato?

¿Cómo calcula Google los sinónimos de los términos en una consulta de búsqueda?