¿Qué técnicas podrían usar datos para predecir un valor específico y asignar un grado de confianza a esa predicción?

La forma clásica: utilice la validación cruzada [1] para obtener una estimación del valor medio previsto en diferentes pliegues y la varianza correspondiente.

De lo contrario, haría lo siguiente:

Para [matemáticas] i \ en {1,2, .., N} [/ matemáticas]:

  1. Elija una semilla aleatoria [2] número [matemática] s_ {i} [/ matemática]
  2. Ejecute su modelo con la semilla seleccionada y guarde las predicciones en una columna [math] p_ {i} [/ math]

Calcule la media (muestra) y la varianza de sus predicciones:

[matemáticas] p_ {m}: = \ frac {1} {N} \ sum_ {i = 0} ^ {N} p_ {i} [/ matemáticas]

[matemáticas] p _ {\ sigma}: = \ frac {1} {N} \ sum_ {i = 0} ^ {N} (p_ {i} -p_ {m}) ^ {2} [/ matemáticas]

En ambos casos, calcule el intervalo de confianza [3] suponiendo una distribución normal (esto no siempre es preciso, pero podría proporcionarle una línea de base).

Lucro.

Espero que esto haya sido útil.

Notas al pie

[1] Validación cruzada (estadísticas) – Wikipedia

[2] Semilla aleatoria – Wikipedia

[3] Intervalo de confianza – Wikipedia

El aprendizaje automático bayesiano se trata de eso …

La mayoría de las técnicas estadísticas hacen esto.

More Interesting

¿Cuál es la naturaleza del big data?

Cómo convertirse en un científico de datos en la NASA

¿Qué gráficos de Nvidia, GeForce o Quadro, son los mejores para aplicaciones de análisis de datos grandes, modelado computacional y ciencia de datos?

¿Qué es big data, análisis de negocios, análisis de datos y cómo uno puede convertirse en analista de datos o científico de datos? ¿Hay algún curso a corto plazo?

¿Existe alguna herramienta de inteligencia empresarial que aproveche algoritmos como "Edgerank" para controlar qué informes se muestran?

Acabo de regresar de Strata 2017 y todas las demás botas mostraban una plataforma de ciencia de datos (es decir, Domino). ¿Cuál es tu plataforma favorita y por qué?

¿Cuáles son las mejores prácticas para construir algo así como un servicio de noticias?

¿Es la velocidad de la luz una restricción para los grandes datos?

¿Qué tiene más alcance y permanecerá durante mucho tiempo en el mercado, la ciencia de datos, la computación en la nube o Hadoop y big data?

Si me uno a Microsoft como Científico de datos sénior y obtengo un rendimiento superior al promedio, ¿cuánto tiempo debo esperar para llegar al nivel principal?

¿Cuáles son los desafíos de construir un equipo de datos en una startup?

¿Cuál es el mejor instituto para la ciencia de datos?

¿Hay algún curso ejecutivo de M.Tech o MS sobre Análisis de Datos o Ciencia de Datos en Chennai?

¿Cómo se usa MySQL en ciencia de datos?

¿Cómo se puede construir un conjunto de datos donde podamos consultar la deuda total para cada sección censal?