Sam Witty dio una gran respuesta, así que me enfocaré en una parte diferente de la pregunta.
los libros de aprendizaje profundo parecen implicar que las muestras solo son útiles para aproximar suma / integrales y cuando el objetivo es generar muestras en sí.
Esas son motivaciones poderosas y estoy hablando 100% en serio. Poderoso.
- ¿Cuáles son los 10 problemas principales en Machine Learning para 2014?
- ¿Podría alguien elaborar la relación entre un lenguaje de máquina, un sistema operativo y un procesador en particular?
- ¿Cuál es el análisis de opinión en el caso de TripAdvisor? ¿Como funciona?
- ¿Es generalmente una buena idea entrenar en caso real, desarrollar y probar conjuntos de datos para la traducción automática?
- Cómo usar el aprendizaje automático en IoT Hardware Security
En primer lugar, todas las probabilidades que nos puedan interesar pueden expresarse en términos de sumas o integrales. Mediante el uso de la teoría de la probabilidad y los procesos estocásticos, podemos averiguar cuándo se pueden estimar a partir de muestras y cómo generar las muestras.
¿Sabes lo que puedes hacer una vez que tienes probabilidades? Casi cualquier cosa.
- Con probabilidades, puede decidir si es probable que un animal sea un gato o un perro.
- ¿Qué posibilidades hay de que este medicamento contra el cáncer provoque complicaciones?
- ¿Lloverá mañana o no?
- ¿Este componente es bueno para este motor o no?
etcétera etcétera.
Pero las sumas y las integrales son más que probabilidades. También pueden representar áreas / volúmenes en algún espacio de alta dimensión. O el resultado de la evolución de un sistema con ruido de alguna condición inicial, como sucede cuando usamos ecuaciones diferenciales estocásticas: no puede resolverlas numéricamente sin alguna forma de muestreo.
Si puede estimar sumas e integrales, puede resolver muchos problemas y el muestreo es una de las formas más poderosas de hacerlo.
Una vez que tenga suficientes muestras, incluso puede reproducir elementos de la distribución utilizada para generarlos: su media, su varianza, momentos más altos, una aproximación de su función de densidad de probabilidad (o función de masa, si la distribución es discreta).
La incertidumbre parece estar integrada en muchos aspectos de nuestro mundo y los modelos más útiles en física, matemáticas, informática, finanzas, etc., incorporan esta incertidumbre mediante el uso de la teoría de la probabilidad, los procesos estocásticos y las estadísticas. El muestreo es lo que hace que muchas aplicaciones en esos dominios sean prácticas.
Por cierto, ha habido un montón de preguntas sobre muestreo motivadas por libros de aprendizaje profundo; esto me hace feliz. Solo tenga en cuenta que el muestreo probabilístico también se usa ampliamente fuera de las redes neuronales, por ejemplo, en física estadística, estadística clásica, solución numérica de ecuaciones diferenciales estocásticas, etc.