La forma clásica: utilice la validación cruzada [1] para obtener una estimación del valor medio previsto en diferentes pliegues y la varianza correspondiente.
De lo contrario, haría lo siguiente:
Para [matemáticas] i \ en {1,2, .., N} [/ matemáticas]:
- ¿Cuál es el significado de los derivados de datos en el contexto de big data?
- ¿Cómo se importan los datos en la programación R y qué metodologías se utilizan?
- ¿Cuáles son los principios de recopilación y análisis de datos?
- Cómo convertirse en un científico de datos en 4-5 meses si no tengo experiencia previa con ningún lenguaje de programación
- ¿Qué tan bien se está utilizando la ciencia de datos en Quora?
- Elija una semilla aleatoria [2] número [matemática] s_ {i} [/ matemática]
- Ejecute su modelo con la semilla seleccionada y guarde las predicciones en una columna [math] p_ {i} [/ math]
Calcule la media (muestra) y la varianza de sus predicciones:
[matemáticas] p_ {m}: = \ frac {1} {N} \ sum_ {i = 0} ^ {N} p_ {i} [/ matemáticas]
[matemáticas] p _ {\ sigma}: = \ frac {1} {N} \ sum_ {i = 0} ^ {N} (p_ {i} -p_ {m}) ^ {2} [/ matemáticas]
En ambos casos, calcule el intervalo de confianza [3] suponiendo una distribución normal (esto no siempre es preciso, pero podría proporcionarle una línea de base).
Lucro.
Espero que esto haya sido útil.
Notas al pie
[1] Validación cruzada (estadísticas) – Wikipedia
[2] Semilla aleatoria – Wikipedia
[3] Intervalo de confianza – Wikipedia